第4章 缺失值
4.4 NA
NA
是R中真正意义上的缺失值。可以用is.na()
函数来判断。
## [1] 2
## [1] 3 8
## [1] 26.5 22.4 25.5 31.0 27.0 20.0 19.4 23.0 30.0
## [1] 26.5 22.4 25.5 31.0 27.0 20.0 19.4 23.0 30.0
## attr(,"na.action")
## [1] 3 8
## attr(,"class")
## [1] "omit"
4.5 缺失值的存在与函数运行
在处理含有缺失值的向量时,很多函数在默认参数下不能工作。
## [1] NA
## [1] 24.97778
# 复制向量
bmi_impute <- bmi
# 对向量进行均值填补
bmi_impute[is.na(bmi_impute)] <- mean(bmi_impute, na.rm=TRUE)
# 填补只会作用于(复制后的)目标向量,对初始向量无影响
writeLines(paste0("填补后的目标向量为:", list(round(bmi_impute, 2)), "\n", "填补后的初始向量为:", list(bmi)))
## 填补后的目标向量为:c(26.5, 22.4, 24.98, 25.5, 31, 27, 20, 24.98, 19.4, 23, 30)
## 填补后的初始向量为:c(26.5, 22.4, NA, 25.5, 31, 27, 20, NA, 19.4, 23, 30)