- 博客(28)
- 收藏
- 关注
原创 R语言分组求和,分组求平均值,分组计数
我们经常可能需要把一个数据按照某一属性分组,然后计算一些统计值。在R语言里面,aggregate函数就可以办到。## S3 method for class 'data.frame'aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE)我们常用到的参数是:x, by, FUN。x, 你想要计算的属性或者列。by, 是一个list,可以指定一个或者多个列作为分组的基础。FUN, 指定一个函数,用来计算,可以作用在所有分组的数据上面。假如
2021-02-20 15:06:40
88943
8
原创 数据可视化工具Top5
今天看了看blog,看看大家都在用什么数据可视化工具。R很重要的一个功能就是强大的数据可视化,所以想看看除了R,Python这种语言类工具,大家还在用什么,看了很多文章,我list出来了这5个。1. Tableauhttps://www.tableau.com/zh-cn是现在很流行的可视化工具,但是收费很贵。有14天免费的Tableau Desktop可以试用,而且在Tableau里面还可以集成R语句进行Tableau不支持的运算。下来打算有时间试试这个集成。2. Microsoft Power
2020-09-28 17:51:26
615
原创 R读取XML数据
XML又叫可扩展标记语言,是一种具有结构性的标记语言,可以结构化的描述信息。XML最初的出现也是为了提供一个标准的数据格式。它便于数据共享,数据传输。也可以用于系统配置,内容管理。在R语言里面读写XML数据可用XML包。XML数据这个是我们这个文章使用的数据,来自 https://www.runoob.com/xml/xml-tree.html。<bookstore> ...
2020-04-11 21:17:14
4862
原创 R读取JSON
随着REST API越来越流行,JSON的使用也多了起来。我今天看看R如何读取JSON文件。这个是我们今天要读取的JSON数据:[ { "Name": "Mario", "Age": 32, "Occupation": "Plumber", "Ranking": 3 }, { "Name": "Peach", "Age": 21, ...
2020-04-11 17:00:40
4302
原创 R Markdown 表格
在上一篇我们讲了R Markdown的基础已经简单的例子。今天来看一下data.frame和matrix在R markdown里面如何展示。默认表格输出这个是直接写R code默认的在html文件里面的输出。library(rmarkdown)render("tables.Rmd", "html_document")格式化输出R里面提供了很多包可以用来格式化在rmarkdown里面...
2020-03-27 18:30:22
7908
原创 R Markdown
R Markdown简介markdown百度百科“Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。”R markdown就是markdown + R code。它可以:1)保存和执行代码;2)生成可以分享的报告;总的来说R Markdown用来将你的数据和R语言的分析过程和结果转化为文档报告,并且分享给别人。更重要的一点...
2020-03-24 15:37:16
1991
原创 女程序员工作十年感悟
1 关于男女研究生毕业作为一枚女程序员已经十年了。所呆过的几个公司和小组男生居多,女生比较少。组里的开发的架构和lead基本都是男生。也说不清楚这个是男性更适合这种工作还是说样本量太少。但是作为一名资深开发,我和组里其他男开发相比,一点也不逊色。但是此从有了小孩之后,感觉自己投入工作的关注度和精力是无法和男生相比的。作为队友的老公照顾小孩也很给力,但是小朋友还是比较粘妈妈。现在每天晚上等小孩睡...
2020-03-12 16:04:55
482
原创 R矩形树状图 treemap
简介treemap又叫矩形树状图。通过嵌套可以显示层次结构,不同与一般的树状图,它同时可以通过矩形面积大小显示数值。这个图片是用treemap包里面的treemap函数自带的demo script画的,显示的是2014年各个国家的人口数量。简单treemap我们先来画一个单层结构的treemap,就是没有嵌套的数据结构。用的数据是从csdn导出的文章访问数据。 ...
2020-03-09 17:52:15
3309
2
原创 R语言气泡图 bubble chart
简介气泡图可以显示三个数值型变量的关系。它是在散点图的基础上,又用气泡的大小来显示第三个数值变量。geom_point绘制气泡图geom_point可以绘制气泡图,只要设置size参数为一个数值变量就可以。这个是我们的数据。number,sales,percent,city12,23,0.45,A23,123,0.12,C45,12,0.78,A23,45,0.67,A32,...
2020-03-06 23:40:38
12558
原创 R语言折线图 line chart
简介折线图是用直线将各个数据点连接起来组成的图形。显示数据的变化趋势,一般是随时间的变化。这个图是北方一城市2019年一月份的高温变化。plotR语言base包里面自带的plot和lines可以画折线图。plot可以单独画折线图,lines必须是在其他图的基础之上,单独不可以。我们先看一个plot的例子。数据还是2019年北方城市一月份的高温。plot(x=tempData$日期,y=...
2020-03-04 16:30:50
4538
原创 R语言面积图 area chart
简介面积图展现了数值型变量随着另外一个变量变化的趋势。一般都是变量随时间的变化。面积图其实就是折线图,只是在线和X轴之间填满了颜色。面积图一般分为两种:重叠面积图,显示各个数值随时间或类别变化的趋势。每一个数值分别显示。有的时候数值会被隐藏起来。堆积面积图,各个数值堆积在一起显示总量。主要是part-to-whole的概念。不单单可以看出总量,而且可以看出每一个数值的对比和对总量的贡献。...
2020-03-01 18:59:33
7743
2
原创 R语言条形图 bar chart
条形图通过条形的高度或者长短来表示数据多少的图形。用来展示分类变量(categorical)的组成和分布。R语言的base包里面有barplot可以绘制条形图。ggplot2包里面有geom_bar可以绘制。barplotbarplot函数barplot(height, width = 1, space = NULL, names.arg = NULL, legend.te...
2020-02-26 19:35:55
5885
1
原创 R语言缺失值 missing values
R语言缺失值有的情况下,数据集里面有的数据值是不知道的,unknown values。对于数据分析来说,一个常见的功能就是缺失值的处理。R语言用NA表示缺失值,not available的意思。1. 缺失值例子数据文件:读入R:> df name age grade1 Lily 23 782 <NA> 24 863 Bob 25 8...
2020-02-23 20:05:13
17583
1
原创 R语言的点图dot plot
点图简介点图又叫Cleveland dot plot,克利夫兰点图。可以在水平线上绘制大量的点,更好的表示点之间的关系。强调数据的排序展示以及数据之间的差距。点图一般是横向展示,所以y轴为类别型变量,x轴为需要展示的数据值。dotchart函数dotchart(x, labels = NULL, groups = NULL, gdata = NULL, ann = par...
2020-02-19 23:25:22
9728
原创 R语言读取excel文件
R语言有很多package可以读取excel文件。我们今天先介绍其中的一种。xlsxxlsx是R语言读和写excel文件的一个包。允许读取excel的一个sheet为data.frame对象,并且把一个data.frame对象写回文件。底层实现,xlsx使用apache的一个java库来实现的。详细信息可以看这里http://poi.apache.org/index.html。可以在R G...
2020-02-17 14:47:22
5518
原创 R语言箱型图 boxplot
boxplot简介boxplot称为箱型图,又叫做盒状图,胡须图。是用来表示数值类型数据分布状况的统计图。它能显示出一组数据的最大值、最小值、中位数、及上下四分位数。四分位数百度百科第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。第三四分位数 (Q3)...
2020-02-06 18:24:39
21848
1
原创 R语言读取csv文件
csv文件Comma-Separated Values,逗号分隔符值,其文件以文本格式存储表格数据。read.csvR语言用read.csv读取csv文件,读取返回一个data.frame的内存对象。read.csv(file, header = TRUE, sep = ",", quote = "\"", dec = ".", fill = TRUE, comment....
2020-02-01 11:18:37
18740
原创 R语言查看函数源代码source code
function是有多个语句组成,完成一个特定的任务。R语言里面有很多内嵌的functions,用户也可以自己定义。比如说sort, summary, help都是R里面常用的function。我们如何查看一个R 函数function的源代码呢?在R里面,想查看一个function的源代码,直接输入function的名字,执行就可以。我们以sort为例子。> sortfunctio...
2019-12-31 10:47:53
3636
原创 R语言的字符串分割 split
R的字符串分割用常用的函数是strsplit。strsplit(x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)x是一个字符串。split分割是用到的字符分隔符。可以为正则表达式。空格分割例子strValue <- "Hello World Henry"strsplit(strValue, " ") #resul...
2019-12-09 17:36:12
17919
原创 R语言data.frame排序 sort
在这篇文章里面介绍了data.frame的基本操作data.frame基本操作。今天写一下data.frame的排序。R基本package里面用的比较多的排序function是order,sort是用来排序vector。order这个是order的用法order(..., na.last = TRUE, decreasing = FALSE, method = c("auto",...
2019-12-09 16:36:52
39727
原创 R语言的help
R提供了大量的help文档,会很有帮助。1. help.start()执行函数help.start()会打开一个浏览器,可以在其中查看各种文档。有基本的R语言介绍,有关于数据的导入导出,还有怎么开发自己的package。2. help(“sort”)查看函数sort的帮助文档。?sort,help(sort)也有同样的功能。3.??sort以sort为关键字在help文档中搜索。hel...
2019-11-29 14:16:57
6672
原创 R语言data.frame基本操作
R语言里面的data.frame就是数据库里面的table,R语言的分析,建模大部分都是基于data.frame数据结构,由rows和columns组成。data.frame每一个column会存储同样的数据类型,可以是numeric, factor, character.创建一个data.frameR用data.frame() function创建一个data.framedata.fr...
2019-10-12 14:32:56
21069
1
原创 R语言的饼图 Pie Chart
饼图是一种圆形统计图形,它被分成若干份来说明数字的比例。R语言里面可以用很多方法来画饼图:piepie(x, labels = names(x), edges = 200, radius = 0.8,clockwise = FALSE, init.angle = if(clockwise) 90 else 0,density = NULL, angle = 45, col = NULL...
2019-09-19 17:06:01
5914
原创 R语言的循环
R语言的循环和C++,Java都比较类似,但是比较简单,一般用于定义用户自己定义的function。forR的for循环的一般样式是: for (name in expr_1) expr_2name是循环的variable, expr_1是一个表示循环指的vector。我们看一个for的例子。repeatrepeat循环的样式是: repeat expr我们看一个repea...
2019-09-17 16:34:04
2211
原创 R语言的group
Group就是分组,在统计里面经常需要把数据按照某一个属性分组后继续算sum,mean之类的统计值。我们用R自带的数据CO2作为例子,Type表示植物所生长的地方,uptake表示二氧化碳吸收率。我们可以按照Type来把数据分组,看看uptake的平均值如何。这个只是简单的group,复杂的可以写代码用loop解决。还有就是R package dplyr提供了group_by的方法,比较好...
2019-08-20 15:50:04
3691
原创 分析stack overflow的关于R问题title
很好奇stack overflow上面的问题的语言分布,然后就用R语言调用它提供的REST API做了一个小程序测试一下。因为使用么有access_token的request会有请求限制,所有今天只是测试了一下R语言的问题。获取所有的R语言问题的title,然后画一个简单的word cloud看看。still因为token的问题,我的R title只有30100条。require("httr"...
2019-08-19 14:31:51
493
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人