3.1 tidyr 介绍

tidyr 的主要目的是将数据变得整洁,整洁的数据表现为:

  1. 每个变量是单独的一列
  2. 每一个观察的值都在自己的行
  3. 每一个值都是独立的单元格

大部分的数据集都是用行和列构成的data.frame。用Excel的单元格来表示,即每列代表不同意义的字段,每行是某个情形下的一系列字段;单元格则是独立的值,属于某个变量的观察值,这样构建的二维数据结构则是“整洁数据”。

3.1.1 安装

tidyr 是 tidyverse 系列的核心成员包,可以安装 tidyverse 或 仅安装 tidyr 。

## 最简单是的方式就是安装tidyverse
install.packages('tidyverse')

## 或者仅仅安装 tidyr:
install.packages('tidyr')

## 或者从github 安装开发版本
## install.packages("devtools")
devtools::install_github("tidyverse/tidyr")

3.1.2 主要功能

tidyr包中的函数可以分为5个主要大类

  • pivot_longer()pivot_wider() 宽转长以及长转宽

  • unnest_longer()unnest_wider(),hoist() 将列表嵌套转化为整洁数据

  • nest() 数据嵌套

  • separate(),extract()拆分列,提取新列

  • replace_na() 缺失值处理