前言

你好,这里是四川师范大学研究生公选课《数据科学中的R语言》的课程内容。考虑到大家来自不同的学院,有着不同的学科背景,因此讲授的内容不会太深奥(要有信心喔)。

比如在课程中以下内容就不会出现

\[ f(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{1}{2} x^{2}} \]

而出现更多的是

跟进本课程的同时, 我强烈推荐大家阅读Hadley Wickham的 r4ds这本书 (Grolemund and Wickham 2017)。作者可是2019年8月刚刚获得考普斯总统奖(被誉为统计学的诺贝尔奖)的大神喔,点击这里可以看他照片。

关于课程

1、课程安排是这样的,每个章节研究的内容都是彼此独立的,大家可以单独阅读每章及运行代码。

  • 基础篇
    • 1 章介绍数据科学基础
    • 2 章介绍R语言基本概念
    • 3 章介绍R语言中的子集选取
  • tidyverse篇
    • 4 章介绍数据可视化
    • 5 章介绍可重复性研究
    • 6 章介绍数据规整与数据处理
    • 7 章介绍字符串处理
    • 8 章介绍函数式编程
    • 9 章介绍探索性数据分析
  • 建模篇
    • 10 章介绍模拟与抽样
    • 11 章介绍方差分析
    • 12 章介绍线性模型
    • 13 章介绍广义线性模型
    • 14 章介绍线性混合模型
    • 15 章介绍贝叶斯分析
  • 应用篇
    • 16 章介绍tidyverse中行方向的操作
    • 17 章介绍tidyverse中的dot
    • 18 章介绍网页爬虫
    • 19 章介绍社会网络分析
    • 20 章介绍心理学中的应用。

2、关于课程目标

  • 课程目标: 熟悉数据科学流程,掌握统计编程技能,能运用探索性分析方法,解决基本的实际应用问题

  • 授课方式:

    • 边写代码边讲
    • 通过案例式、问题式的方法,增强参与感和目标感
  • 课堂要求

    • 自带电脑,配好运行环境
  • 考核方式: 以下方式任选其一

    • 指定数据集,完成探索性分析报告
    • 围绕本学科领域的数据科学应用,调研数据并撰写实验报告
    • 参加数据驱动竞赛
    • 完成一篇学术论文

3、关于如何提问

有的同学,这样一上来就问:老师,我的代码怎么运行不出来呢?或者图省事,干脆手机拍个照片一发。

  • 我想说,要想获得快速的帮助,在问问题之前,请先告诉对方三个信息:
    • 想解决的问题是什么?
    • 代码是什么?
    • 报错信息是什么?

RYouWithMe

致谢

非常感谢川师研究生院的信任, 有了您的支持,才会有更多的川师学子了解R的美!

王敏杰
于 川师图书馆某角落

参考文献

Grolemund, Garrett, and Hadley Wickham. 2017. R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. 1 edition. Houston: O’Reilly Media. http://r4ds.had.co.nz/.