3.1 tidyr 介绍
tidyr 的主要目的是将数据变得整洁,整洁的数据表现为:
- 每个变量是单独的一列
- 每一个观察的值都在自己的行
- 每一个值都是独立的单元格
大部分的数据集都是用行和列构成的data.frame
。用Excel的单元格来表示,即每列代表不同意义的字段,每行是某个情形下的一系列字段;单元格则是独立的值,属于某个变量的观察值,这样构建的二维数据结构则是“整洁数据”。
3.1.1 安装
tidyr 是 tidyverse 系列的核心成员包,可以安装 tidyverse 或 仅安装 tidyr 。
## 最简单是的方式就是安装tidyverse
install.packages('tidyverse')
## 或者仅仅安装 tidyr:
install.packages('tidyr')
## 或者从github 安装开发版本
## install.packages("devtools")
::install_github("tidyverse/tidyr") devtools
3.1.2 主要功能
tidyr
包中的函数可以分为5个主要大类
pivot_longer()
和pivot_wider()
宽转长以及长转宽unnest_longer()
和unnest_wider()
,hoist()
将列表嵌套转化为整洁数据nest()
数据嵌套separate()
,extract()
拆分列,提取新列replace_na()
缺失值处理