内容概要
主要内容是为了将数据报表,数据报告,数据可视化等需求利用 R 语言自动化实现,从而解放双手。
数据导入导出
读 Excel:readxl,openxlsx;写 Excel:openxlsx,writexl,读写 CSV,TSV,TXT 等:readr,vroom,data.table;
数据操作 dplyr
数据整洁 tidyr
字符处理 stringr
日期时间处理 lubridate
因子处理 forcats
数据处理利器 data.table
数据库使用
主要是 odbc,DBI,ROracle,RMySQL等
循环结构
循环迭代之purrr包介绍
自定义函数功能
文件系统管理
在本书中,数据操作处理分为:tidyverse 系列,data.table 两大语法体系,任选其一学习即可,待对 R 语言认知更深,以及更加清楚自己的需求后再行调整数据处理框架体系。就我个人而言,我目前使用 data.table 体系做数据处理较多,当然不可避免的需要借助其他 R包。