如果学过Java或其他高级语言,应该有枚举类型这个概念,个人理解,R中的factor类似于这个枚举类型,但又有不同,毕竟Java中的enum本质上是整数,可以当成整数使用,但R中的factor却不可以直接当整数来使用,例如不能对factor类型的数据进行大小比较。但是可以进行等于或不等于的比较。
如果要进行大小比较,可以把factor类型的数据转换为字符型或数字型再比较。
(1) 创建factor
>mycolor<-factor(c("R","G","G","R","B"),levels =c("R","G","B"),labels=c("RED","GREEN","BLUE"))
> mycolor
[1] RED GREEN GREEN RED BLUE
Levels: RED GREEN BLUE
> groupId<-factor(sample(1:3,10,rep=T))
> groupId
[1] 3 3 3 2 2 3 2 2 1 2
Levels: 1 2 3
(2)等于或不等于的比较
> mycolor[mycolor=='GREEN']
[1] GREEN GREEN
Levels: RED GREEN BLUE
> mycolor[mycolor!="GREEN"]
[1] RED RED BLUE
Levels: RED GREEN BLUE
> groupId[groupId==3]
[1] 3 3 3 3
Levels: 1 2 3
(3) 大小比较
> groupId[groupId<3]
[1] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
Levels: 1 2 3
Warning message:
In Ops.factor(groupId, 3) : ‘<’ not meaningful for factors
转换类型后比较:
> groupId[as.numeric(groupId)<3]
[1] 2 2 2 2 1 2
Levels: 1 2 3
本文介绍了R语言中的factor类型,它类似枚举但不可直接用作整数。主要内容包括如何创建factor、进行等于或不等于的比较以及如何处理大小比较时的限制。示例展示了如何创建factor对象,以及在比较操作中遇到问题时转换数据类型的方法。
1571

被折叠的 条评论
为什么被折叠?



