R中常用的数据结构有四种:向量、矩阵、数据库和列表
(1)基本操作
1.向量的创建
c()函数创建向量;seq()函数创建等差数列的向量;sample()从一列数字中随机抽取几个数;paste0()把数字和字符串有规律的组合起来
rm(list = ls()) #从指定的环境中删除对象
movie = read.csv("电影数据.csv", fileEncoding = "UTF-8", stringsAsFactors = F)
c(1, 1, 1, 2, 3, 3, 1, 2, 4, 1, 2, 4, 4, 2, 3, 4, 1, 2, 3, 4)
## [1] 1 1 1 2 3 3 1 2 4 1 2 4 4 2 3 4 1 2 3 4
class(c)
#[1] "function"
c("a", "b", "c", "d")
## [1] "a" "b" "c" "d"
# seq(起始值, 终止值, 步长)
seq(0, 10, by = 2)
## [1] 0 2 4 6 8 10
1:10
## [1] 1 2 3 4 5 6 7 8 9 10
# sample(被抽取的数据集合, 抽取数量)
set.seed(1234)
sample(1:10, 5)
## [1] 2 6 5 8 9
paste0("x_", 1:5)
## [1] "x_1" "x_2" "x_3" "x_4" "x_5"
2.向量的引用
which()函数可以获取某个元素的位置;which.max()和which.min()函数可以直接获取最大值和最小值的位置
# 引用x向量中的第5个元素
x=c(1, 1, 1, 2, 3, 3)
x[5]
## [1] 3
# 想看看x向量中3所在的位置
which(x == 3)
## [1]