- 博客(7)
- 收藏
- 关注
原创 R summarize+group_by分组摘要
上一篇文章中写到了管道,这部分主要写一下处理缺失值,计数,常用的摘要函数,按多个变量分组和取消组。一、处理缺失值有两种比较好的方法:①使用na.rm=TRUE;②使用!is.na()场景一:我们想计算一下飞机飞行距离及延误到达时间。delay<- flights%>% group_by(dest)%>% summarize( count=n(), #起到计数的作用 dis = mean(distance), arr_delay = me
2022-11-29 20:17:18
664
原创 R学习 使用dplyr进行数据转换
dplyr有五个核心函数:函数 功能 arrange() 对行进行重新排列 select() 按名称选取变量 mutate() 使用现有变量的函数创建变量 summarize() 对多这个值总结为一个摘要统计量 group_by() 可以改变以上每个函数的作用范围 步骤:第一个参数数据框→输入变量名(描述数据要进行的操作)→输出数据框...
2022-03-31 21:57:54
774
原创 3.29 R 坐标系学习
难点:对坐标系的调整可能是比较难的,因为可能会导致x轴有重叠的部分。第一个函数:coord_flip()函数,可以交换x轴,y轴例如:ggplot(data=mpg,mapping=aes(x=class,y=hwy))+ geom_boxplot()ggplot(data=mpg,mapping=aes(x=class,y=hwy))+ geom_boxplot()+ coord_flip()第二个函数:coord_quickmap()可以为地图设置合适的纵横比.
2022-03-29 21:10:38
851
原创 3.29 位置调整学习R
fill和color可以完成对条形图的上色。但两者是有区别的:fill能够实现对条形图不同颜色的分类,而color是对边框的颜色进行填充。position参数设定的功能是可以调整位置的。1.position=“identity”将每个对象直接进行显示。这样看是不是有点不清楚,可以将其变成透明色,加个alpha=1/5,即可实现。或者加fill=NA2.position=fill,做出的图和百分百堆叠图有点相似。3.position=“dodge”,将每组中的条..
2022-03-29 14:22:53
850
原创 3.28 学习R笔记及遇到的小问题
一张图上使用了两种几何对象。了解ggplot函数的30多种几何对象,可以学习ggplot速查表。一张图上显示多个几何对象。ggplot(data=mpg)+geom_smooth(mapping=aes(x= ,y= ,color= )+geom_point(mapping=aes(x= ,y= ,color= )))这种方式不太适用于多个几何对象,需要一个个添加参数,难免会有遗漏。有一种方法是可以将一组重复映射到ggplot函数中。像这样:ggplot(data=mpg,mapping=a
2022-03-29 11:10:11
294
原创 初次使用Rstudio遇到的一些小问题及笔记
第一次导入tidyverse包时,显示报错,主要原因是未设置镜像,镜像的位置是:之后,就不会再报错了。开始编写R语言:mgp是美国汽车相关表。拿到这个数据之后先考虑汽车大小和耗油量之间是什么关系?正相关?负相关?线性关系?非线性关系?编写:ggplot(data=mgp)+ ...
2022-03-28 09:36:23
597
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人