2 dplyr
dplyr包是tidyverse系列中的核心包之一,dplyr是A Grammar of Data Manipulation ,即dplyr是数据处理的语法。
与sql相比,用R实现相同功能的好处:
代码量极大减少
当逻辑复杂时,
R可以按照顺序一步步实现,无需嵌套,实现过程简单该包就是从数据库相关操作中抽象而来,迁移成本低
配合
dbplyr包使用,大部分情况下可以扔掉sql语法,从而实现不同数据库间语法并不完全一致时,代码可重复使用
本章节利用R语言完成与Excel透视表或sql语句的功能,将从行条件筛选、排序、分组聚合、表关联等方面记录R的实现方式。
本章节会照搬dplyr包中的部分案例