
R语言
文章平均质量分 69
bgods
这个作者很懒,什么都没留下…
展开
-
ggplot2学习笔记之qplot
ggplot2 之从qplot 开始qplot 是包ggplot2 中的一个快速画图函数,如果你已经对R 的基础包画图函数plot基本掌握,那么qplot 就很容易掌握了。install.packages(‘ggplot2’) #安装ggplot2包library(ggplot2) #加载ggplot2包set.seed(1410) #设置随机种子dsmall <- diamonds[sampl原创 2015-09-19 21:19:38 · 2618 阅读 · 0 评论 -
使用 dplyr 包进行数据操作与清洗 | EthanDeng(转载)
本文转载自:使用 dplyr 包进行数据操作与清洗 | EthanDeng+http://ddswhu.com/2015/02/05/dplyr-data-clean-manipulation/转载请注明以上原文地址。使用 dplyr 包进行数据操作与清洗 在我们数据分析的实际应用中,我们可能会花费大量的时间在数据清洗上,而如果使用 R 里面自带的一些函数(base 包的 transform 等)转载 2015-12-16 12:11:45 · 1464 阅读 · 0 评论 -
60 个实用的 R 语言技巧(转载)
本文转载自: 60 个实用的 R 语言技巧 | EthanDeng +http://ddswhu.com/2015/09/07/60-r-tips/转载请注明以上的原文地址。 本文内容来源于 Rstatistics.net 的 60 R Tips,这些都是作者们长期使用 R 积累下来的一些技巧或者建议。我觉得这个内容挺好的,并且在书上看不到这些内容,所以做了搬运和翻译,重点是加了例子,否则如果只看转载 2015-12-16 12:57:52 · 3633 阅读 · 0 评论 -
R语言:表达式、数学公式、特殊符号
在R语言的绘图函数中,如果文本参数是合法的R语言表达式,那么这个表达式就被用Tex类似的规则进行文本格式化。y <- function(x) (exp(-(x^2)/2))/sqrt(2*pi)plot(y, -5, 5, main = expression(f(x) == frac(1,sqrt(2*pi))*e^(-frac(x^2,2))), lwd = 3, col = "blue")lib原创 2020-08-11 11:05:47 · 57714 阅读 · 0 评论 -
ggplot2学习笔记之分面
分面是一个强大的工具,可以快速分析出数据各子集模式的异同。ggplot2 提供了两种分面类型。1.网格分面(facet_grid) 网格分面在2 维网格中展示图形。输入数据时,你需要考虑哪些变量作为行,哪些变量作为列,规则如下:不进行分面:即不使用函数facet_grid()或者使用facet_null(),此时得到的是单独画板;ggplot(mtcars, aes(mpg, wt)) + g原创 2015-10-29 14:32:59 · 1958 阅读 · 0 评论 -
ggplot2学习笔记之手动离散型标度
使用以下手动型标度可以定制新的标度:scale_colour_manual(..., values)、scale_fill_manual(..., values)、scale_size_manual(..., values)、scale_shape_manual(...,values)、scale_linetype_manual(..., values)等。使用这些标度,可以对图形的...原创 2015-10-24 22:09:18 · 4748 阅读 · 0 评论 -
ggplot2学习笔记之颜色标度
除了位置标度之外,最常用的图形属性就是颜色了。对于连续型变量有三种基于渐变的方法,对于离散型有两种方法。rgb 编码的色彩空间使用了红、绿、蓝三种光的强度来表示一种颜色,这种色彩空间存在个问题:视觉感知上不均匀。这里使用的是hcl 色彩空间的现代方案,它分别由色相(hue)、彩度(chroma)、明度(luminance)三部分构成。 以下标度对边界色(co...原创 2015-10-24 21:42:14 · 58889 阅读 · 0 评论 -
ggplot2学习笔记之标度scale
标度(scale),是将数据空间(标度的定义域)映射到图形属性空间(标度的值域) 的一个函数。 每一种图形属性都有一个默认的标度,当我们每一次使用这个图形属性时都会自动 添加到图形中。 图形属性 离散型 连续型 颜色(colour)和填充色(fill) brewer、grey、hue、identity、manual gradient、gradient2、gradientn原创 2015-10-09 21:22:59 · 19851 阅读 · 0 评论 -
CentOS 安装R语言
环境准备在编译R之前,需要通过yum安装以下几个程序:# 使用root用户su root# 安装gcc-gfortranyum install gcc-gfortran# 安装gcc gcc-c++yum install gcc gcc-c++# 安装readline-develyum install readline-devel# 安装libXt-develyum install lib原创 2015-11-09 13:09:08 · 1302 阅读 · 0 评论 -
ggplot2学习笔记之位置标度
每一幅图形一定拥有两个位置标度,一个指定水平位置(x 标度),另一个是指定竖直标度(y 标度)。ggplot2 提供了连续性、离散型(针对因子型、字符型、逻辑向量)、以及日期型。 对所有的位置坐标来说,修改坐标轴范围是一项常见任务,使用辅助函数xlim()和ylim()可以减轻我们工作量。比如:xlim(10,20):从10 到20 的连续型标度;xlim(”a”, “b”, “c”):离散型原创 2015-10-09 21:54:22 · 3328 阅读 · 1 评论 -
R语言连接Mysql数据库的步骤及简单使用(学习笔记)
实验环境:win8.1-64操作系统,MySQL5.61、下载(mysql-connector-odbc-5.3.4-winx64.msi) 下载地址:http://dev.mysql.com/downloads/connector/odbc 2、安装mysql-connector-odbc-5.3.4-winx64.msi(安装按照默认就好了)3、配置datasourcewindow原创 2015-11-05 10:49:53 · 7319 阅读 · 3 评论 -
jiebaR中文分词快速入门
参考这篇于jiebaR中文分词帮助文档,做个笔记方便学习。1. 分词jiebaR提供了四种分词模式,可以通过函数worker()来初始化分词引擎,使用函数segment()进行分词。具体使用?worker查看帮助====================================简单用法举例说明====================================text <- '你要明白,原创 2015-10-19 15:18:35 · 11258 阅读 · 3 评论 -
jiebaR中文分词,并做词云(R语言)
使用结巴中文分词(jiebaR)对之前爬取的新浪新闻 文本进行分词,统计词频之后,使用包wordcloud画词云。1、读入数据以下数据是在这里爬取的,这里只对社会新闻类进行测试,文件还是比较大的。分词完有一千多万个词,处理完后有将近30万。library(jiebaR)library(wordcloud)#读入数据分隔符是‘\n’,字符编码是‘UTF-8’,what=''表示以字符串类型读入f原创 2015-10-16 21:34:12 · 29797 阅读 · 8 评论 -
ggplot2学习笔记之构建图层
传统的画图函数(如plot、qplot)就好比在一张画布上画图,画好之后不能修改,而且只能使用一个数据集;而图层的思想是在多张透明的画布上绘图,再把这些画布按顺序叠加在一起形成一个完整的图形。每一张画布都可以使用不同数据集,可以单独对每一个图层进行修改,需要到哪些图层就画哪些图层。1.创建绘图对象在用 ggpot()绘制时,需先创建绘图对象,也就是第一个图层,它包含两个参数(数据与图形属性映射)。原创 2015-09-25 18:37:27 · 5389 阅读 · 0 评论 -
XML和XPath使用方法备忘(转载)
XML和XPath使用方法备忘(转载)如果把XML看作传统的关系数据库,那么XPath就是SQL。R语言中的XML包可用来解析处理XML或是HTML数据。在之前的文章中,我们了解到readHTMLTable函数,如果页面中的数据是一个规整的表格,用它是很方便的,但如果页面中是一些非结构化的数据,就要用到XML包中的其它函数了。其中最重要两个函数是xmlTreeParse()和getNodeSet()转载 2016-03-09 21:07:08 · 1587 阅读 · 0 评论