- 博客(65)
- 资源 (1)
- 收藏
- 关注
原创 R语言ggplot2 | 热图+随机森林重要性!升级版~
定义了ggrf_ggcor_plot()函数,该函数能够做到一键生成随机森林+热图。
2024-03-22 19:20:29
3001
1
原创 R语言ggplot2 | R语言绘制物种组成面积图(三)
面积图又叫区域图。它是在折线图的基础之上形成的, 它将折线图中折线与自变量坐标轴之间的区域使用颜色或者纹理填充,这样一个填充区域我们叫面积。颜色的填充可以更好地突出趋势信息(比如时间上的差异,分类上的差异),需要注意的是颜色要带有一定的透明度,透明度可以很好地帮助使用者观察不同序列之间的重叠关系,没有透明度的面积会导致不同序列之间相互遮盖减少可以被观察到的信息。与折线图相似,面积图可用于强调数量随时间或分类而变化的程度,也可用于引起人们对总值趋势的注意。他们最常用于表现趋势和关系,而不是传达特定的值。
2023-08-10 11:09:00
1666
原创 【R模型】R语言线性回归之简单线性回归模型 (一)
线性回归,又称普通最小二乘线性回归或简称OLS回归,是由数学家高斯和勒让德在19世纪初左右独立发展起来的,至今仍有关于谁应该为其发现负责的争论。然而,在它被发现的时候,它实际上并不被称为“回归”。这个词在弗朗西斯·高尔顿(Francis galton)的作品之后变得更加流行。高尔顿是英国知识分子中的多面手,也是查尔斯·达尔文的表亲。19世纪晚期,高尔顿研究了近1000名儿童的身高与其父母平均身高(父母中等身高)之间的关系。
2023-05-22 08:04:28
4896
1
原创 【R模型】R语言并行计算随机森林模型
并行计算基本上是指在同一实例中使用两个或两个以上(或处理器)来解决一个存在的问题。这里的主要目标是将任务分解为更小的子任务并同时完成它们。一个简单的示例将阐明并行计算的核心思想:如果没有并行运行的过程是:1)输入变量的数值这一看,节省了很多步骤,肯定比上面步骤所运行速度估计得快很多。
2023-05-03 21:38:56
952
2
原创 【R统计】R语言不等长的多重比较—字母标记法
一般来说,在多重比较时候,最大的值是标a,但这里是根据不同水平出现的先后顺序标的,所以有点不尽如人意,所以有了下面的函数。一般来说,anova是可以完成多重比较的,但由于数据是非等长,因此统计功效会大幅缩减,这里故而使用非参数检验 pairwise.wilcox.test()函数。看到在不同水平下,y的数量并不相同,需求就是对比不同水平下y是不是存在显著差异,因为有3个factor,最好是循环完成3个factor下的工作。至此,已经完成了所有非参数的多重比较,按照均值大小标注字母。
2023-05-03 21:19:03
1495
4
原创 R语言ggplot2 | R语言绘制物种组成冲积图(一)
不存在左右先后顺序,不存在箭头表示先后,左右的位置可以随意互换。左/右位置没有特别的意义,尺寸可以按任何顺序排列。
2023-04-25 13:34:52
752
原创 R语言ggplot2 | R语言绘制物种组成堆叠柱状图(二)
堆叠柱状图可以形象地展示一个大分类包含多个小分类的数据,以及各个小分类的占比,显示的是单个分类与总体间的关系。常见的堆叠柱状图:每个柱子上的值分别代表不同的数据大小,各子分类的数据总和代表整根柱子的高度。适用于比较每个分组的数据总量。百分比堆叠柱状图:柱子的各个层代表的是该类别数据占该分组总体数据的百分比。适用于比较各组间的相对变化。
2023-04-25 13:32:25
4943
2
原创 【R统计】美国18年死亡率的分布情况(地图)-- 循环处理与绘图
这里,我想传达的是:学习R语言的最终目的,并不是仅仅为了复制他人代码满足自己的目的,而是能够编写相应的代码来完成(例如,自定义函数、循环函数、编写和创建R包等等)。学习不能一蹴而就,但是R语言算是比较特殊的,它成就感来的比较快,比如今天学一个画图,自己能够模仿编写代码,这在短时间是可以实现的。因为这个数据是1999-2016共18年的数据,我的思路是根据每年先生成18个数据集,然后将他们拆分到每个数据集中,再用将他们打包成list合并,便于后续用到的函数(其要求对象是list数据结构)做准备。
2023-04-21 23:44:48
625
原创 R语言ggplot2 | 修改ggplot主题
与其他软件相比,R语言善于绘图,并且绘图质量极高,其中ggplot2作为R语言绘图神器更是被频繁使用。ggplot2绘图系统拥有图例调整系统、主题调整系统、标签调整系统。但是在实际应用中,我们常因为美化图形主题而感到麻烦,这里面主要是因为记不住复杂的主题调整参数。因此就想,有没有一个能够像Excel那样使用鼠标进行傻瓜式的点点点就可以修改图形。今天在这里向大家介绍一个简单快捷的方法——在实际的ggplot使用中,主题参数众多,我们在可以看到theme的参数众多且复杂。
2023-04-21 23:21:50
1655
原创 R语言ggplot2 | 给图片添加上下标
每次都用PPT来调整图中的细节很麻烦,今天分享R语言添加下标、上标,并且探索在不同位置图元素添加上标和下标。
2023-04-21 23:12:27
4170
原创 自定义函数 | R语言批量计算组间差值
为了处理两列或者多列以及多变量重复样本间的组合差值,编了一个函数进行批量处理。今天与大家分享中我编写的一个cal_repeat函数。为了实现2列变量重复样本的组合差值计算,如图所示:这是y的三个重复值与x的三个重复值组合做差,得出9个新的差值。如何使用R代码?然而,实际情况下,数据集中可能存在实验处理甚至很多个,也可能不只一个目标变量,分组变量也不仅只有2个(也就是x和y可能还有更多需要相互进行组合运算的变量)。
2023-04-21 23:03:44
1533
1
原创 【R生态】R语言维恩图(Venn)&集合图(Upset)的选择与绘制
通常,大家对维恩图的了解较多,因为它在所发表的文章中比较常见。然而,当集合的数量种类较多(超过5个时),其可视化显得杂乱无章。事实上,这两类图所展示的内容的本质是一样的,可以根据自身的实际情况,选择合适自己文章的图形。时,相比于维恩图,集合图展示的结果(不同组的特有或共有信息)依然清晰(当然集合图也是可以改颜色的,这个大家不用担心并不是如此黑)。因此,我们要做的就是根据自己数据的情况,选择合适的集合图形。在进行数据的集合可视化时,即突出不同处理、各组样本之间独有或共有的特征或元素,可以利用。
2023-04-21 08:16:56
4468
原创 【R统计】R语言循环单因素方差分析
数据加载好后,我们需要核查数据,确保无误(必须要求为数值型向量),随后对各样地在六年中植被生物量进行单因素方差分析。是单因素方差分析和多重比较中比较常用的函数,大家肯定非常熟悉,但平时可能进行数据分析的时候需要做很多次方差分析,因此批量单因素方差分析也是很有必要学习和掌握的。需要注意的是,这份数据中有的样地只有一年的数据,这些数据是不能进行差异分析的,我们需要把他们挑出来。函数进行单因素方差分析和多重比较,当我们只有一组(单个样地)的数据时,我们可以直接用如下代码进行单因素方差分析,并获得对应的标签。
2023-04-20 21:33:35
2213
1
原创 【R生态】R语言CPCoA-限制性主坐标分析
CPCoA分析也是属于排序分析的一种。它与PCA,PCoA不同,与CCA或RDA类似。(前者属于非限制性,后者属于限制性;非限制性=非约束性=无监督,限制性=约束性=有监督=典范)这里不过多描述,参考原理,该文对于非限制性和限制性有较为详细的介绍。咱们主要描述R语言实现过程,由于原来函数是计算对应值并直接展示固定的绘图结果,我对amplicon包中函数提取了计算结果的代码。
2023-04-20 00:15:45
2451
原创 入门必学 | Rstudio的快捷键
为了让部分刚接触r语言与rstudio的新手学起来少走些弯路,这里展示了一张rstudio界面的简单介绍图。希望这张图能够给大家带来一些帮助~
2023-04-19 09:52:38
2906
原创 R语言ggplot2 | 绘制随机森林重要性+相关性热图
在文献中,我们经常遇到随机森林和相关性热图的组合图片(下图),它由一幅叠加变量重要性圆圈的相关性热图和一幅说明因变量被解释程度的条形图组成。今天,我们将试着用自己的数据在R里面去复现这类图。
2023-04-19 00:15:36
12184
11
原创 入门必学 | R语言将全矩阵转化为上三角或下三角矩阵
将全矩阵转化成上三角矩阵或者下三角矩阵,这是R语言基础,入门必学。在过程中,主要使用diag函数以及matrix、paste、dim、t等函数的使用。
2023-04-14 09:19:59
2699
原创 【R模型】R语言二元logistic回归 (保姆级教程)
逻辑函数最初是由比利时数学家Pierre François Verhulst在19世纪中期引入的,作为人类、动物和某些植物和水果物种的人口增长建模工具。那时,人们普遍认为,人口增长不可能永远呈指数级增长,环境和资源的限制对人口的规模施加了最大的限制。Verhulst函数的公式为:其中e是指数常数,x0是x在中点的值,L是y的最大值(称为“承载力”),k是曲线的最大斜率。
2023-04-10 00:12:06
19561
1
原创 R语言ggplot2 | 三元图
三元图,顾名思义,是一个等边三角形式的图像,它将本该是三维的x,y,z三轴转化为二维的三角形展示出来,三角形的三个角可以是一个或者一组样本,通过观察三角形中点的位置判断样本在三组间的分布状况。通常这类图用于展示组学数据(进行差异表达基因的分析),作为延伸,也可以用来分析微生物16S/ITS/18S扩增子宏基因组数据,并且可以结合火山图分析,探究微生物在三组样本间的富集状况。
2023-04-02 21:49:14
1335
2
原创 R语言ggplot2 | 告别AI和PS,地表最全R语言拼图
R语言能够完成拼图的包应该有多种。本篇博文中,我给大家总结了地表最常用的四种拼图包,分别是patchwork、cowplot、ggpubr、customLayout。这几个拼图包都可以与绘图神器"ggplot2"包完美的结合,必须掌握。只要我们把这几个包都掌握了就可以与AI、PS真正地say goodbye了~
2023-04-01 19:11:21
2898
原创 【R模型】R语言xgboost模型对分类数据进行预测
xgboost是Boost(提升)算法家族中的一员,Boost根本思想在于通过多个简单的弱分类器,构建出准确率很高的强分类器。简单地来说,Boost(提升)就是指每一步我都产生一个弱预测模型,通过加权累加到总模型中,可以用于回归和分类问题。如果每一步的弱预测模型生成都是依据损失函数的梯度方向,则称之为梯度提升(Gradient boosting),这样若干步以后就可以达到逼近损失函数局部最小值的目标。
2023-03-21 00:55:59
6039
3
原创 第一年创作纪念日--一点点积累,慢慢改变
回忆了一下,来到优快云已经4年多了。从无知的获取与学习,到无私的贡献与学习,写下了我在优快云的第一篇博客。回忆整个学习过程,充满了快乐,辛苦,兴奋,成就。创作的初衷,是为了记录下自己在R语言世界中的成长,也希望能够将R实战过程中遇到的问题或者经验分享给其他人,通过优快云博客也认识了很多志同道合的朋友,欢迎大家一起进行技术交流。写博客是一件开心的事情,希望我日后的每篇博客能如同自己的初衷一样,对自己有用,同时能够帮助其他人。未来一年,希望自己可以输出更多高质量的博客,也希望能够认识更多志同道合的朋友。
2023-03-19 21:53:22
77
原创 R语言ggplot2 | 用百分比格式表示数值
在 R 中将数字格式化为百分比的最简单方法是使用 scales 包中的 percent() 函数。# 此函数使用以下语法: percent(x , accuracy = 1)不懂的函数可以先help或者?函数名(前提需要先加载对应R包)介绍主要的参数:x : 要格式化为百分比的对象accuracy : 要四舍五入的数字。例如,使用 .01 舍入到小数点后两位。
2023-03-08 21:47:14
3560
原创 【R模型】R语言bootstrap检验两个模型斜率的显著性差异
该函数中n阶循环是指可能你的数据集存在多种处理,也就是说存在不同处理变量间组合成新的子数据集。该函数的输出结果返回一个数据框,包含不同处理及bootstrap重采样的模型斜率的结果,最后可以利用统计学检验不同处理变量间的显著性差异。第一,可以实现不同类型模型的斜率比较;第二,可以解决不同变量处理间的多阶循环。主要参数的介绍data : 数据集R : bootstrap的次数sub : 需要对哪些变量进行划分成子数据集的循环equa : 对应构建模型的fomula。
2023-03-08 17:24:46
3544
7
原创 【R生态】非参数多元检验(ADONIS、ANOSIM、PERMANOVA及MRPP等多元方差分析)
R语言多元方差分析ADONIS、ANOSIM、PERMANOVA及MRPP的应用~
2023-02-17 00:04:36
14021
7
原创 【R生态】普鲁克分析(Procrustes Analysis)
普鲁克分析(Procrustes analysis)是一种用于形状分布的分析方法。数学上:通过不断迭代,寻找标准形状(canonical shape),并利用最小二乘法寻找每个样本形状到这个标准形状的仿射变化方式。普氏分析可基于不同多元数据集的排序构型(≥2组),通过平移、旋转、缩放等转换方式,实现最大叠合(maximal superimposition),用于各数据集间的对比分析。排序方法可选择PCA、PCoA、NMDS等。
2022-12-29 11:56:23
4674
向ChatGPT提问的艺术.pdf
2023-05-10
中小学生计算机课程.txt
2023-04-25
一份简单的计算机课程设计内容
2023-02-13
MATLAB中的一个数据分析示例代码,用于一个数据集,其中包含一个人每天消耗的卡路里数量的数据
2023-02-13
r语言各类型plot函数
2023-02-12
R语言数据分析案例-鸢尾花-IRIS
2023-02-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人