’探索性数据分析‘学习过程对R语言知识的回顾

#9.12实验一内容

安装包、加载包

install.packages("tidyverse")
library(dplyr)

安装包,括号内须有引号。加载包,则不需要加引号。

工作目录

getwd()
dir.create('D:/211')
setwd('D:/211')

getwd()查看当前路径

dir.create()创建文件夹

setwd()修改当前路径为括号内内容

注意:路径在Rstudio中“\”需写为“/”,否则会报错

summary函数

获取描述性统计量,可以提供最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计等,包括对数据框中字段的描述。

summary(head(HairEyeColortb,3))
##      Hair               Eye                Sex                 Freq      
##  Length:3           Length:3           Length:3           Min.   :10.00  
##  Class :character   Class :character   Class :character   1st Qu.:21.00  
##  Mode  :character   Mode  :character   Mode  :character   Median :32.00  
##                                                           Mean   :31.67  
##                                                           3rd Qu.:42.50  
##                                                           Max.   :53.00

cbind()不同的列拼接在一起

HairEyeColortb2<-cbind(id,HairEyeColortb$Hair,HairEyeColortb$Eye,HairEyeColortb$Sex,HairEyeColortb$Freq)

有时候在拼接的过程中会出现拼接后的矩阵列名不对的情况,可以使用colnames对列名进行修改

colnames(HairEyeColortb2)<-c('id','Hair','Eye','Sex','Freq')

filter函数,根据字段的值选择出行

filter(HairEyeColortb2,HairEyeColortb2$Hair=='Black'&HairEyeColortb2$Eye=='Brown')
## # A tibble: 2 × 5
##   id    Hair  Eye   Sex    Freq 
##   <chr> <chr> <chr> <chr>  <chr>
## 1 1     Black Brown Male   32   
## 2 17    Black Brown Female 36

filter(表名,条件)

select函数,根据字段名选择出列

select(HairEyeColortb2, id, Hair, Freq)

你可以直接对数据框对象应用select()函数,而不需要使用$运算符来指定列。

arrange函数 按照列排序

arrange(select(HairEyeColortb2, id, Hair, Freq), desc(Freq))

arrange(表,字段)

desc表示降序排列,如果是要根据数值大小排列,一定要注意字段的类型是否为数值型,否则需要提前使用as.numeric()转换为数值型

未完待续……

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值