2 dplyr
dplyr
包是tidyverse
系列中的核心包之一,dplyr是A Grammar of Data Manipulation ,即dplyr是数据处理的语法。
与sql
相比,用R实现相同功能的好处:
代码量极大减少
当逻辑复杂时,
R
可以按照顺序一步步实现,无需嵌套,实现过程简单该包就是从数据库相关操作中抽象而来,迁移成本低
配合
dbplyr
包使用,大部分情况下可以扔掉sql
语法,从而实现不同数据库间语法并不完全一致时,代码可重复使用
本章节利用R
语言完成与Excel透视表
或sql
语句的功能,将从行条件筛选、排序、分组聚合、表关联等方面记录R
的实现方式。
本章节会照搬dplyr包中的部分案例