2 数据读取(readr)

2.1 读取 read.table

读取普通数据可用 read.table,有6个参数比较重要:

  • file:文件路径
  • sep:文件的分隔符,缺省无
  • skip:跳过开始的 skip 行开始读取
  • header:是否将第一行读取为列名,缺省 FALSE
  • nrows:读取的行数
  • fill:将缺失数据定为 NA, 缺省并无指定

2.2 高阶包 readr

也可用 readr 包读取表格型数据,不仅速度快,且能直接读取为 tbl 格式。参考 readr 介绍

library(readr)

read_csv 和 read_tsv 分别读取分隔符为逗号和制表符的数据,read_csv2 则是读取分号分割的数据,read_dlim 读取自定义的。

函数定义:

# read_delim(file, delim, quote = "\"", escape_backslash = FALSE,
#  escape_double = TRUE, col_names = TRUE, col_types = NULL,
#  locale = default_locale(), na = c("", "NA"), comment = "", skip = 0,
#  n_max = -1, progress = interactive())

write_csv 用于写入数据,不写入行名。

函数定义

# write_csv(x, path, na = "NA", append = FALSE, col_names = !append)