2 dplyr

dplyr包是tidyverse系列中的核心包之一,dplyr是A Grammar of Data Manipulation ,即dplyr是数据处理的语法。

sql相比,用R实现相同功能的好处:

  • 代码量极大减少

  • 当逻辑复杂时,R可以按照顺序一步步实现,无需嵌套,实现过程简单

  • 该包就是从数据库相关操作中抽象而来,迁移成本低

  • 配合dbplyr包使用,大部分情况下可以扔掉sql语法,从而实现不同数据库间语法并不完全一致时,代码可重复使用

本章节利用R语言完成与Excel透视表sql语句的功能,将从行条件筛选、排序、分组聚合、表关联等方面记录R的实现方式。

本章节会照搬dplyr包中的部分案例