因子 factor,是用来处理分类数据的,分类数据又分为有序和无序,有序(年级:低中高,性别:男女)。
整数向量+标签label,因子优于整数向量。在线性和线性模型中经常会用到。
创建因子、基线水平
#factor
x <- factor(c("female","female","male")) //在没有指定基线水平时,按照数字、字母排序
y <- factor(c("female","female","male"), levels=c("male","female")) //设定基线水平
table(x) //查看因子统计
unclass(x) //去掉因子的水平输出,但是变量本身没有改变
class(unclass(x)) //去掉水平后,变为了整数向量
注意:levels是因子的一个属性,levels中的第一个就是基线。因子去掉levels属性之后就变成一个整数向量了。