基于R语言的科研信息分析与服务
2021-05-24
前言
在图书馆开设R语言系列讲座也有一年半载了,在此过程中我萌生了用R语言写一本书的想法,一方面是想为学生提供R语言学习范例,另一方面也借此为我校科研人员提供一些科研信息服务。如果此举能做到教学相长,更好地实践和应用数据科学,也算是一次很有意义的尝试,无奈自己时间精力有限,写书进展缓慢。
本书内容
本书数据处理和可视化用到 tidyverse, 您也可以参考我的课件《数据科学中的 R 语言》。
- 第 1 章简单介绍数据科学与R语言,
- 第 2 章引入科研信息数据集,并利用tidyverse宏包进行数理统计和数据可视化,
- 第 3 章统计科研论文中通讯地址使用情况,并给出写作的规范建议,
- 第 4 章介绍了各学院对ESI学科的贡献,以及期刊对引文的贡献,
- 第 5 章基于中科院JCR期刊分区分析我校科研人员的选刊倾向,
- 第 6 章统计分析期刊引证报告以及中国SCI期刊的情况,
- 第 7 章讨论四川省部分高校科研合作网络,
- 第 8 章预测四川省部分高校的潜力学科,
- 第 9 章基于中科院期刊等级分区分析论文影响力结构,
- 第 10 章基于机器学习和引文模式,预测科研成效与学术影响力,
- 第 11 章利用文本挖掘技术分析文献主题词,
- 第 12 章分析期刊影响因子和特征因子,帮助科研人员选择合适期刊,
- 第 13 章分析基金资助情况,
- 第 14 章分析高被引论文,提炼当前研究热点和主题,
- 第 15 章尝试引文分析,分析引文之间的耦合关系和共现关系等,
- 第 16 章讨论共现矩阵在信息服务中的应用,
- 第 17章利用文本挖掘技术分析文献摘要等等,更多内容和章节未完待续…
- 第 19章介绍bibliometrix的宏包,以及引文分析
- 第 20章介绍作者信息提取和规整
未来想法
- 使用tidyESI宏包,方便地处理数据
- 四川省最近五年的题录(包括引文,与后面bibliometrix的要统一数据来源)
- 兼顾(tidyverse擅长的格式和bibliometrix能处理的格式)
- 以Claus O. Wilke的《Fundamentals of Data Visualization》 为指导, 重新精细化图片
- 有项目经费,才好启动,但感觉这是个人爱好,估计很难了,只有自己写书
- 如果要想有项目,也可以,比如用shiny,实时在线生成各竞争高校的,科研学术发展动态指示图
- 批量下载使用[< G:\Guide_DS_Perl6\0.0.7 >],配置好文件后,直接执行
perl6 -Ilib wos.p6
用到的宏包
<-
my_packages c("tidyverse", "here", "fs", "knitr", "kableExtra", "ggraph", "igraph", "tidygraph",
"googleVis", "googleVis", "ggpubr", "widyr", "wordcloud2", "bibliometrix"
)
install.packages(my_packages, repos = "http://cran.rstudio.com", dependencies = T)
可能用到的开发版本的宏包
::install_github("perlatex/tidyESI") devtools
RYouWithMe
致谢
非常感谢川师图书馆对我的帮助。
王敏杰 于 川师图书馆某角落