10.R因子类型

本文介绍了R语言中因子的使用,包括如何创建因子、转换因子以及利用table()和tapply()函数进行统计分析。此外,还提到了forcats包在因子处理中的作用,如排序和合并水平。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


(学习资料参考北京大学李东风老师《R语言教程》)

10 R因子类型

10.1 因子

R中用因子代表数据中分类变量, 如性别、省份、职业。 有序因子代表有序量度,如打分结果,疾病严重程度等。

factor() 函数把字符型向量转换成因子,如:

x <- c("男", "女", "男", "男",  "女")
sex <- factor(x)
sex

在这里插入图片描述
下面看一下sex的属性:

attributes(sex)

在这里插入图片描述
因子有class属性,取值为"factor", 还有一个levels(水平值)属性, 此属性可以用 levels() 函数访问,如:

levels(sex)

在这里插入图片描述
因子的levels属性可以看成是一个映射, 把整数值1,2,映射成这些水平值, 因子在保存时会保存成整数值1,2,等与水平值对应的编号。 这样可以节省存储空间, 在建模计算的程序中也比较有利于进行数学运算。

as.numeric() 可以把因子转换为纯粹的整数值,如:

as.numeric(sex)

将性别用数字代表:
在这里插入图片描述
as.character() 可以把因子转换成原来的字符型,如:

as.character
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值