前言

在图书馆开设R语言系列讲座也有一年半载了,在此过程中我萌生了用R语言写一本书的想法,一方面是想为学生提供R语言学习范例,另一方面也借此为我校科研人员提供一些科研信息服务。如果此举能做到教学相长,更好地实践和应用数据科学,也算是一次很有意义的尝试,无奈自己时间精力有限,写书进展缓慢。

这本书是这样的, 第 1 章简单介绍数据科学与R语言, 第 2 章引入科研信息数据集,并利用tidyverse宏包进行数理统计和数据可视化, 第 3 章统计科研论文中通讯地址使用情况,并给出写作的规范建议, 第 4 章介绍了各学院对ESI学科的贡献,以及期刊对引文的贡献, 第 5 章基于中科院JCR期刊分区分析我校科研人员的选刊倾向, 第 6 章统计分析期刊引证报告以及中国SCI期刊的情况, 第 7 章讨论四川省部分高校科研合作网络, 第 8 章预测四川省部分高校的潜力学科, 第 9 章基于中科院期刊等级分区分析论文影响力结构, 第 10 章基于机器学习和引文模式,预测科研成效与学术影响力, 第 11 章利用文本挖掘技术分析文献主题词, 第 12 章分析期刊影响因子和特征因子,帮助科研人员选择合适期刊, 第 13 章分析基金资助情况, 第 14 章分析高被引论文,提炼当前研究热点和主题, 第 15 章尝试引文分析,分析引文之间的耦合关系和共现关系等, 第 16 章讨论共现矩阵在信息服务中的应用, 第 17章利用文本挖掘技术分析文献摘要等等,更多内容和章节未完待续…

本书的代码可以公开,您完全可以重复每一过程。本书使用的数据集我放在百度网盘里,大家可以点击这里免费下载。

我用了两个 R 包编译这本书,分别是 knitr (Xie 2015)bookdown (Xie 2018)。以下是我的 R 进程信息:

sessionInfo()
## R version 3.5.2 (2018-12-20)
## Platform: x86_64-w64-mingw32/x64 (64-bit)
## Running under: Windows 10 x64 (build 17134)
## 
## Matrix products: default
## 
## locale:
## [1] LC_COLLATE=Chinese (Simplified)_China.936 
## [2] LC_CTYPE=Chinese (Simplified)_China.936   
## [3] LC_MONETARY=Chinese (Simplified)_China.936
## [4] LC_NUMERIC=C                              
## [5] LC_TIME=Chinese (Simplified)_China.936    
## 
## attached base packages:
## [1] stats     graphics  grDevices utils     datasets 
## [6] methods   base     
## 
## loaded via a namespace (and not attached):
##  [1] compiler_3.5.2  magrittr_1.5    bookdown_0.9   
##  [4] tools_3.5.2     htmltools_0.3.6 rstudioapi_0.8 
##  [7] yaml_2.2.0      Rcpp_1.0.0      stringi_1.2.4  
## [10] rmarkdown_1.11  knitr_1.21      stringr_1.3.1  
## [13] xfun_0.4        digest_0.6.18   evaluate_0.12

致谢

非常感谢张平杉、王一、沙玉萍、曹秀丽、陈琴以及彭凤老师对我的帮助。

王敏杰 于 川师图书馆某角落

参考文献

Xie, Yihui. 2015. Dynamic Documents with R and Knitr. 2nd ed. Boca Raton, Florida: Chapman; Hall/CRC. http://yihui.name/knitr/.

Xie, Yihui. 2018. Bookdown: Authoring Books and Technical Documents with R Markdown. https://CRAN.R-project.org/package=bookdown.