
R语言与数据可视化
文章平均质量分 77
R语言学习与使用R语言做数据可视化,涉及ggplot2
镰刀韭菜
视野,意志,品格;目标,坚持,实践
展开
-
Ubuntu Server 16.04中R包的默认地址
/home/ubuntu/R/x86-64-pc-linux-gnu-library/3.2//usr/local/lib/R/site-library/原创 2018-05-03 09:43:38 · 487 阅读 · 0 评论 -
【机器学习】R语言标准化(归一化)之scale()函数、sweep()函数
R语言标准化(归一化)之scale()函数、sweep()函数#数据集x<-cbind(c(1,2,3,4),c(5,5,10,20),c(3,6,9,12))#自己写标准化x_min_temp<-apply(x,2,min) x_min<-matrix(rep(x_min_temp,4),byrow=TRUE,ncol=3) #需要输入行数和列数...原创 2018-12-12 20:56:39 · 13417 阅读 · 0 评论 -
R语言多线程操作
R 语言多线程操作parallel包parLapply简单的代码实战foreach包foreach简单的代码实战目录R 语言多线程目录parallel包包的安装包中常用函数parLapply的简单代码实战检查当前核数启动集群和关闭集群parLapply执行多线程计算时间开销对比上一级环境中变量的引入foreach包包的安装foreach的使用上一级环境中变量的引入parallel包包的安装inst...转载 2018-05-23 20:33:21 · 12266 阅读 · 2 评论 -
R语言数据可视化教程(ggplot2)_描述常见的数据分布及注释操作
# 6.描述数据分布# 6.1 绘制简单直方图# 运用geom_histogram()函数并映射一个连续型变量到参数xlibrary(ggplot2)ggplot(faithful,aes(x=waiting))+geom_histogram()# geom_histogram()函数只需要数据框的其中一列或者一个单独的数据向量作为参数# 将变量值保存为一个基本向量w <- faithful...原创 2018-05-21 23:38:11 · 10864 阅读 · 0 评论 -
【R语言】R语言异常或错误处理
R语言异常或错误处理问题1:在使用R语言(RCurl包)抓取网页的过程中,往往会因为有些页面超时,或者页面不存在而导致程序因为异常中断退出,进而使自动批量抓取数据的程序中断,这时就需要有人工干预,重新运行程序或重新启动服务,从而导致维护成本增加。问题2:使用R语言进行数据处理时,常常需要写批处理程序实现程序自动处理,但是可能会出现一些意想不到的错误,从而导致自动化过程中断,这时需要人工干预...转载 2019-01-21 21:29:25 · 40248 阅读 · 1 评论 -
【R语言】cbind和rbind函数
cbind和rbind函数cbind: 根据列进行合并,即叠加所有列,m列的矩阵与n列的矩阵cbind()最后变成m+n列,合并前提:cbind(a, c)中矩阵a、c的行数必需相符rbind: 根据行进行合并,就是行的叠加,m行的矩阵与n行的矩阵rbind()最后变成m+n行,合并前提:rbind(a, c)中矩阵a、c的列数必需相符 > a <- matrix(1:...原创 2018-12-31 10:24:23 · 54737 阅读 · 3 评论 -
【R语言】频繁项集挖掘之Eclat算法
频繁项集挖掘之Eclat算法1.Eclat算法Eclat算法用于执行项集挖掘。项集挖掘让我们在数据中找到频繁的模式,就像消费者购买牛奶一样,他也会购买面包。这种类型的模式称为关联规则,用于许多应用领域。Eclat算法的基本思想是使用tidset交集来计算候选项集的支持,从而避免生成前缀树中不存在的子集。它最初是由Zaki,Parthasarathy等人提出的。算法Eclat算法...原创 2019-01-25 22:53:40 · 5051 阅读 · 2 评论 -
【R语言】常用的R语言数据挖掘包
常用的R语言数据挖掘包与Python相比,R语言的很多算法分别会有不同的作者实现,而每个人有不同的实现方式,所以会产生大量的package。因此,学习R语言需要广泛了解与所研究问题相关的包,这样就比较耗时耗力。在此,整理了一些在数据挖掘中常用的R包,以供参考::1、聚类 常用的包: fpc,cluster,pvclust,mclust 基于划分的方法: kmeans, pa...原创 2019-01-25 22:26:35 · 4085 阅读 · 0 评论 -
【R语言】R语言常用函数:交集intersect、并集union、找不同setdiff、判断相同setequal
交集intersect、并集union、差集setdiff、判断相同setequal在使用R语言进行生物信息数据分析的过程中,需要经常比较不同集合之间元素的共性和差异,所以需要使用到交集、并集、找不同、判断相同等操作。交集:intersect两个向量的交集,集合可以是数字、字符串等# 两个数值向量取交集intersect(x=1:4, y = 2:6)# [1] 2 3 4...原创 2018-12-30 16:41:37 · 13775 阅读 · 0 评论 -
【R语言】Permutation Tests
Permutation Tests用于构建抽样分布的越来越常见的统计工具是置换测试(或有时称为随机化测试)。与自举一样,置换测试通过重新采样观察数据来构建 - 而不是假设 - 采样分布(称为“置换分布”)。具体而言,我们可以“混洗”或置换观察到的数据(例如,通过从实际观察到的结果集中的每个观察中分配不同的结果值)。与bootstrapping不同,我们无需替换即可完成此操作。排列测试在实验...原创 2019-01-25 17:17:16 · 4656 阅读 · 0 评论 -
【R语言】4种R包安装方式
4种R包安装方式第一种方式,当然是R自带的函数直接安装包了,这个是最简单的,而且不需要考虑各种包之间的依赖关系。对普通的R包,直接install.packages()即可,一般下载不了都是包的名字打错了,或者是R的版本不够,如果下载了安装不了,一般是依赖包没弄好,或者你的电脑缺少一些库文件,如果实在是找不到或者下载慢,一般就用repos=来切换一些镜像。 > in...转载 2018-12-14 02:49:12 · 158268 阅读 · 2 评论 -
R语言数据可视化教程(ggplot2)_绘制条形图与折线图
# 绘制条形图# 3.1 简单条形图# 使用ggplot()函数和geom_bar(stat="identity")library(gcookbook)ggplot(pg_mean,aes(x=group,y=weight))+geom_bar(stat = "identity")# 当x是连续型(数值型)变量时,ggplot不是只在实际取值处绘制图形,而将在x轴上介于最大值# 和最小值之间所有可...原创 2018-05-21 23:32:41 · 22862 阅读 · 1 评论 -
R语言数据可视化教程(ggplot2)_绘制散点图
# 5.散点图# 散点图通常用来刻画两个连续型变量之间的关系# 5.1 绘制散点图# 运行geom_point()函数,分别映射一个变量到x和ylibrary(gcookbook)library(ggplot2)# 列出用到的列heightweight[,c("ageYear","heightIn")]ggplot(heightweight,aes(x=ageYear,y=heightIn))+g...原创 2018-05-21 23:36:16 · 16621 阅读 · 1 评论 -
R语言数据可视化教程(ggplot2)_坐标轴设置
# 8.坐标轴# 8.1交换x轴和y轴# 使用coord_flip()来翻转坐标轴library(ggplot2)ggplot(PlantGrowth,aes(x=group,y=weight))+geom_boxplot()ggplot(PlantGrowth,aes(x=group,y=weight))+geom_boxplot()+coord_flip()# 如果x变量是一个因子型变量,则排...原创 2018-05-21 23:40:02 · 56542 阅读 · 2 评论 -
R语言数据可视化教程(ggplot2)_控制图形的整体外观及增加图例
# 9.控制图形的整体外观# 9.1 设置图形标题# 使用ggtitle()设置标题library(ggplot2)library(gcookbook)p <- ggplot(heightweight,aes(x=ageYear,y=heightIn))+geom_point()p + ggtitle("Age and Height of Schoolchildren")# 使用\n来换行p...原创 2018-05-21 23:42:01 · 7420 阅读 · 1 评论 -
R语言数据可视化教程(ggplot2)_R基础与散点图的绘制
# 第一章 R基础install.packages(c("ggplot2","gcookbook"))library(ggplot2)library(gcookbook)# 加载分隔符式的文本文件# data <- read.csv("datafile.csv")# data <- read.csv("datafile.csv",header=FALSE)# 手动为列名赋值# name...原创 2018-05-21 23:30:16 · 5503 阅读 · 1 评论 -
R语言数据可视化教程(ggplot2)_其他图形
# 13.其他图形# 13.1 绘制相关矩阵图mtcarsmcor <- cor(mtcars)# 输出mcor,保留两位小数round(mcor,digits = 2)# 如果数据含有不能用来计算系统的任何列,应该先将这些列剔除。# 如果在原始数据中存在缺失值(NA),得到的相关矩阵中也会有缺失值。# 可以使用函数选项use="complete.obs"或者use="pairwise.co...原创 2018-06-01 23:44:27 · 6710 阅读 · 1 评论 -
R语言数据可视化教程(ggplot2)_输入图形以展示
# 第14章 输出图形用以展示# 一般而言,数据可视化为两个目标服务:发现和沟通。# 14.1 输出为PDF矢量文件# 有两种方法输出PDF文件。一种方法是,使用pdf()打开图形设备,绘制图形,然后使用dev.off()关闭图形设备。这种方法适用于R中的大多数图形,包括基础图形和基于网格的图形# width(宽度)和height(高度)的单位为英寸library(ggplot2)pdf("3dp...原创 2018-06-01 23:46:24 · 5263 阅读 · 1 评论 -
R语言数据可视化教程(ggplot2)_数据塑形
# 15 数据塑型# 在将数据转化为图形之前,需要对数据进行清理然后重新组织数据的结构# R中的数据集常以数据框的形式存在。它们都是点形的二维数据结构,每行代表一个具体对象(case),每列代表一个描述对象的变量。# 数据框本质上是由向量和因子组成的列表,其中每个向量或因子代表了数据的一列library(gcookbook)heightweightstr(heightweight)# 因子和字符型...原创 2018-06-01 23:47:46 · 4683 阅读 · 1 评论 -
R语言数据可视化教程(ggplot2)_分面与配色
# 11.分面# 11.1 使用分面将数据分割绘制到子图中# 使用facet_grid()或facet_wrap()函数,并指定根据哪个变量来分割数据。# 使用facet_grid()函数时,可以指定一个变量作为纵向子面板分割的依据,并指定另外一个变量作为横向子面板分割的依据library(ggplot2)# 基本图形p <- ggplot(mpg,aes(x=displ,y=hwy))+g...原创 2018-05-24 22:11:43 · 11422 阅读 · 1 评论