6 forcats

我在实际工作中因子数据类型使用较少,forcats软件包用来处理因子,该软件包是tidyverse的一部分.

因子是用于对数据进行分类的R的一种数据类型. 它们可以存储字符串和整数.它们在具有有限数量的唯一值的列中很有用. 像“男性”,“女性”和True,False等。它们在统计建模的数据分析中很有用.

因子变量会占用更小空间,R4.0改变了字符默认为因子的方式.想了解更多请参考 https://r4ds.had.co.nz/factors.html

object.size(rep(letters,100000))
object.size(rep(forcats::as_factor(letters),100000))