#9.12实验一内容
安装包、加载包
install.packages("tidyverse")
library(dplyr)
安装包,括号内须有引号。加载包,则不需要加引号。
工作目录
getwd()
dir.create('D:/211')
setwd('D:/211')
getwd()查看当前路径
dir.create()创建文件夹
setwd()修改当前路径为括号内内容
注意:路径在Rstudio中“\”需写为“/”,否则会报错
summary函数
获取描述性统计量,可以提供最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计等,包括对数据框中字段的描述。
summary(head(HairEyeColortb,3))
## Hair Eye Sex Freq
## Length:3 Length:3 Length:3 Min. :10.00
## Class :character Class :character Class :character 1st Qu.:21.00
## Mode :character Mode :character Mode :character Median :32.00
## Mean :31.67
## 3rd Qu.:42.50
## Max. :53.00
cbind()不同的列拼接在一起
HairEyeColortb2<-cbind(id,HairEyeColortb$Hair,HairEyeColortb$Eye,HairEyeColortb$Sex,HairEyeColortb$Freq)
有时候在拼接的过程中会出现拼接后的矩阵列名不对的情况,可以使用colnames对列名进行修改
colnames(HairEyeColortb2)<-c('id','Hair','Eye','Sex','Freq')
filter函数,根据字段的值选择出行
filter(HairEyeColortb2,HairEyeColortb2$Hair=='Black'&HairEyeColortb2$Eye=='Brown')
## # A tibble: 2 × 5
## id Hair Eye Sex Freq
## <chr> <chr> <chr> <chr> <chr>
## 1 1 Black Brown Male 32
## 2 17 Black Brown Female 36
filter(表名,条件)
select函数,根据字段名选择出列
select(HairEyeColortb2, id, Hair, Freq)
你可以直接对数据框对象应用select()
函数,而不需要使用$
运算符来指定列。
arrange函数 按照列排序
arrange(select(HairEyeColortb2, id, Hair, Freq), desc(Freq))
arrange(表,字段)
desc表示降序排列,如果是要根据数值大小排列,一定要注意字段的类型是否为数值型,否则需要提前使用as.numeric()转换为数值型
未完待续……