12、R语言中变量与观测值的选择方法详解

R语言中变量与观测值的选择方法详解

1. 变量选择方法

1.1 基础选择方法对比

在R语言中,选择变量有多种方式。例如,使用 subset 函数选择变量是一种较好的方式,如:

summary(
  subset(mydata, select=c(q1,q2) ) # Good.
)

而下面这种方式则不同:

summary( c(mydata$q1,mydata$q2) ) # Not good.

它会在分析前将两个向量合并成一个长向量。虽然 subset 函数的独特语法可能会让一些R用户感到困扰,但它的实用性远超其怪异之处。

1.2 使用列表索引选择变量

数据框也可以看作是一个列表,列表的组件是构成数据框列的向量。可以使用两个方括号内的索引值来引用列表的这些组件。例如,选择第三个变量可以使用:

summary( mydata[[3]] )

不过,冒号运算符不能用于提取第3到第6个变量,如下代码:

mydata[[3:6]]
# Will NOT get variables 3 through 6.

1.3 从变量名生成索引

可以使用冒号运

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值