前言

你好,我的初衷是想记录R语言系列讲座的内容,目前排版还很乱,待我慢慢整理。

这本书是这样的, 第 1 章介绍R语言入门以及数据科学流程, 第 2 章介绍数据可视化, 第 3 章介绍可重复性研究, 第 4 章介绍数据规整与数据处理, 第 5 章介绍函数式编程, 第 6 章介绍非标准评估框架, 第 7 章介绍探索性数据分析, 第 8 章介绍机器学习, 第 9 章介绍预测建模, 第 10 章介绍正则表达式, 第 11 章介绍网络爬虫。 第 12 章介绍文本挖掘。 第 13 章介绍社会网络分析, 第 14 章介绍地理数据处理, 第 15 章介绍统计推断。 第 16 章介绍贝叶斯数据分析, 第 17 章介绍时间序列分析。 第 18 章介绍科学计量学。 第 19 章介绍国外kaggle案例以及国内数据驱动大赛。

每个章节研究的内容都是彼此独立的,大家可以单独阅读和运行代码。

我用了两个 R 包编译这本书,分别是 knitr (Xie 2015)bookdown (Xie 2018)。以下是我的 R 进程信息:

sessionInfo()
## R version 3.5.2 (2018-12-20)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 17134)
## 
## Matrix products: default
## 
## locale:
## [1] LC_COLLATE=Chinese (Simplified)_China.936 
## [2] LC_CTYPE=Chinese (Simplified)_China.936   
## [3] LC_MONETARY=Chinese (Simplified)_China.936
## [4] LC_NUMERIC=C                              
## [5] LC_TIME=Chinese (Simplified)_China.936    
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets 
## [6] methods   base     
## 
## loaded via a namespace (and not attached):
##  [1] compiler_3.5.2  magrittr_1.5    bookdown_0.9   
##  [4] tools_3.5.2     htmltools_0.3.6 rstudioapi_0.8 
##  [7] yaml_2.2.0      Rcpp_1.0.0      stringi_1.2.4  
## [10] rmarkdown_1.11  knitr_1.21      stringr_1.3.1  
## [13] xfun_0.4        digest_0.6.18   evaluate_0.12

致谢

非常感谢谁谁以及谁谁对我的帮助。艾玛,要不是他们神一样的队友,我两年前就写完这本书了。

王敏杰
于 川师图书馆某角落

参考文献

Xie, Yihui. 2015. Dynamic Documents with R and Knitr. 2nd ed. Boca Raton, Florida: Chapman; Hall/CRC. http://yihui.name/knitr/.

Xie, Yihui. 2018. Bookdown: Authoring Books and Technical Documents with R Markdown. https://CRAN.R-project.org/package=bookdown.