与R纠缠的两件事——rownames和子集--转载

本文分享了作者在使用R语言过程中的实践经验,包括解决rownames和colnames应用中的常见问题,以及如何正确处理数据子集选取时的数据类型问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

与R语言纠缠了一个星期,从快速上手的暗暗得意,到之后某些细节的纠结烦躁,过山车式体验中,我逐渐才认识了真实的R语言。

期间遇到两个很烦恼的问题,一个是让人烦躁抓狂,另一个是无意发现的重大错误。

1.      令人抓狂的rownames

若数据矩阵datamatrix如图1,无列名和行名及表头。若c1~c4分别为colnames,而r1~r5为rownames,表头为A。

图1:datamatrix

如何添加c1~c4?r1~r5?

coln = c(”c1”,”c2”,”c3”,”c4”)

rown = c(”r1”,”r2”,”r3”,”r4”,”r5”)

colnames(datamatrix) = coln

rownames(datamatrix) = rown

如何添加表头A?

colnames(datamatrix) = c(“A”,”c1”,”c2”,”c3”,”c4”)

上述命令会直接报错,列数不匹配。

colnames(datamatrix)[1] = “A”

上命令会让矩阵变成​如图2所示

图2:datamatrix

究其本质,都是因为colnames()函数默认调用的都是真实数据上(x1~x4)的列名,而不认识行名上(r1~r5)的列名。

       正确添加表头命令为:

       datamatrix= cbind(rownames(datamatrix),datamatrix)#将行名加入矩阵

       rownames(datamatrix)[1]= “A”

实现后矩阵如图3,

图3:datamatrix

另外

​read.table或wirte.table中也有row.names和col.names条件格式。与上rownames和colnames不仅书写上有区别,意义上也有。row.names用于指定行名。数值为k时,则将第k列设置为列名,并将其从数据矩阵中移除。而write.table中row.names=F将矩阵的行名剔除后写进table.

2.      子集选取("numeric"和"character"之争)

genename =

            CRHBP,….

mode(genename)  =

         “numeric”

m1 为如下矩阵

图4:m1

mode(m1)  =

           "numeric"​

若要在m1中选取genename对应的id所在行的子集,命令应该为:

m1[genename,]

​但结果很诡异,返回的并不是id对应为CRHBP所在行,返回却是CRHR1所在行

 

要想返回所选的行,必须先将genename转换为character类型,才是准确的。

genename <- as.character(genename)

m1[genename,]

此时,结果才​为所求行。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值