12、R语言中变量与观测值的选择方法详解

最新推荐文章于 2025-07-17 11:23:42 发布

对方正在偷人346

最新推荐文章于 2025-07-17 11:23:42 发布

阅读量4

点赞数

CC 4.0 BY-SA版权

分类专栏：从Stata到R：数据科学的桥梁文章标签： R语言变量选择观测值选择

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/grpc6streamer/article/details/149592764

从Stata到R：数据科学的桥梁专栏收录该内容

35 篇文章 ¥399.00 ¥499.90

订阅专栏

超级会员免费看

R语言中变量与观测值的选择方法详解

1. 变量选择方法

1.1 基础选择方法对比

在R语言中，选择变量有多种方式。例如，使用 subset 函数选择变量是一种较好的方式，如：

summary(
  subset(mydata, select=c(q1,q2) ) # Good.
)

而下面这种方式则不同：

summary( c(mydata$q1,mydata$q2) ) # Not good.

它会在分析前将两个向量合并成一个长向量。虽然 subset 函数的独特语法可能会让一些R用户感到困扰，但它的实用性远超其怪异之处。

1.2 使用列表索引选择变量

数据框也可以看作是一个列表，列表的组件是构成数据框列的向量。可以使用两个方括号内的索引值来引用列表的这些组件。例如，选择第三个变量可以使用：

summary( mydata[[3]] )

不过，冒号运算符不能用于提取第3到第6个变量，如下代码：

mydata[[3:6]]
# Will NOT get variables 3 through 6.

1.3 从变量名生成索引

可以使用冒号运

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。