内容概要

主要内容是为了将数据报表,数据报告,数据可视化等需求利用 R 语言自动化实现,从而解放双手。

  • 数据导入导出

    读 Excel:readxl,openxlsx;写 Excel:openxlsx,writexl,读写 CSV,TSV,TXT 等:readr,vroom,data.table;

  • 数据操作 dplyr

  • 数据整洁 tidyr

  • 字符处理 stringr

  • 日期时间处理 lubridate

  • 因子处理 forcats

  • 数据处理利器 data.table

  • 数据库使用

    主要是 odbc,DBI,ROracle,RMySQL等

  • 循环结构

  • 循环迭代之purrr包介绍

  • 自定义函数功能

  • 文件系统管理

在本书中,数据操作处理分为:tidyverse 系列,data.table 两大语法体系,任选其一学习即可,待对 R 语言认知更深,以及更加清楚自己的需求后再行调整数据处理框架体系。就我个人而言,我目前使用 data.table 体系做数据处理较多,当然不可避免的需要借助其他 R包。