R语言中变量与观测值的选择方法详解
1. 变量选择方法
1.1 基础选择方法对比
在R语言中,选择变量有多种方式。例如,使用 subset
函数选择变量是一种较好的方式,如:
summary(
subset(mydata, select=c(q1,q2) ) # Good.
)
而下面这种方式则不同:
summary( c(mydata$q1,mydata$q2) ) # Not good.
它会在分析前将两个向量合并成一个长向量。虽然 subset
函数的独特语法可能会让一些R用户感到困扰,但它的实用性远超其怪异之处。
1.2 使用列表索引选择变量
数据框也可以看作是一个列表,列表的组件是构成数据框列的向量。可以使用两个方括号内的索引值来引用列表的这些组件。例如,选择第三个变量可以使用:
summary( mydata[[3]] )
不过,冒号运算符不能用于提取第3到第6个变量,如下代码:
mydata[[3:6]]
# Will NOT get variables 3 through 6.
1.3 从变量名生成索引
可以使用冒号运