在本课程中,我们将了解如何根据指定的条件从向量中提取元素。
例如,我们可能只对向量的前20
个元素感兴趣,或者仅对非NA
的元素感兴趣,或者对正数或与感兴趣的特定变量相对应的那些元素感兴趣。
现在有这么一个向量x
,里面包含20
个服从标准正态分布的数字和20
个NA
。
> x
[1] NA NA NA -0.05108979 NA -0.02086817 -0.65883869 NA -0.76755803 -0.94629711 NA
[12] NA 0.25171708 0.18031701 -0.37318508 -0.98855340 -1.68402326 NA NA NA -0.99748631 NA
[23] NA NA NA -0.21191859 NA 0.61580651 0.15191893 -0.84210911 NA NA NA
[34] -0.02113655 NA NA 0.03523937 1.77489019 -0.16145833 -1.51209270
在R
中,想从向量里选择某些特定元素(即“子集”)的方式是,将“索引向量”放在向量名称后方括号中。比如x[1:10]
,就可以获得x
向量的前10
个元素。
> x[1:10]
[1] NA NA NA -0.05108979 NA -0.02086817 -0.65883869 NA -0.76755803 -0.94629711
索引向量有4
种不同的形式-逻辑向量,正整数向量,负整数向量和字符串向量-我们将在本课程中分别介绍。
逻辑索引
让我们首先从逻辑向量开始。处理实际数据时,一种常见的情况是我们要提取向量中非NA
的所有元素。回想一下