R语言数据分析系列之一
—— by comaple.zhang
写在前面:关于R的优势网上已经很多了,略去不表,这里只表干货。
这是我第一篇关于R的博客,打算写个系列教程,带领你一步一步进入R的神奇世界,最后用一个例子做实战讲解,希望能够分享给您,也为您的工作带来某些益处,您的支持是我的动力,谢谢。
数据类型
numeric 数值型
> x <- c(1:10)
> x
[1] 1 2 3 4 5 6 7 8 9 10
> mode(x)
[1] "numeric"
complex 复数类型
> x <- 100 +1i
> x
[1] 100+1i
> mode(x)
[1] "complex"
logical 逻辑型
> x <- c(sample(1:10,5))
> x
[1] 2 3 8 7 10
> x <- x==3
> x
[1] FALSE TRUE FALSE FALSE FALSE
> mode(x)
[1] "logical"
第一行用采样的方式随机创建一个向量,并用来判断该项量与3的值是否相等,结果赋值给x
character 字符型
> x <- 'comaple.zhang'
> x
[1] "comaple.zhang"
> mode(x)
[1] "character"
> nchar(x)
[1] 13
factor 因子型
> x <- sample(1:5,10,replace=T)
> x
[1] 2 4 4 4 4 1 5 4 1 2
> x <- as.factor(x)
> x
[1] 2 4 4 4 4 1 5 4 1 2
Levels: 1 2 4 5
因子类型很有用, 其中的levels代表着你的因子的水平,即:去重以后的类别。在你处理数据集分类的时候就方便多了。当你改变你的因子level的时候,你会发现你的数据其实也跟着改变了如下:
> levels(x)
[1] "1" "2" "4" "5"
> levels(x)[3] <- 't'
> x
[1] 2 t t t t 1 5 t 1 2
Levels: 1 2 t 5