- 博客(32)
- 收藏
- 关注
原创 tidyverse|数据分析常规操作-分组汇总(sumamrise+group_by)
| 本文首发于 “生信补给站” https://mp.weixin.qq.com/s/tQt0ezYJj3H7x3aWZmKVEQ使用tidyverse进行简单的数据处理:盘一盘Tidyverse| 筛行选列之select,玩转列操作盘一盘Tidyverse| 只要你要只要我有-filter 筛选行Tidyverse|数据列的分分合合,一分多,多合一Tidyverse| XX_join :多个数据表(文件)之间的各种连接本次介绍变量汇总以及分组汇总。一 summarise 汇总汇总函数 su
2020-07-06 22:59:10
2473
原创 ComplexHeatmap|根据excel表绘制突变景观图(oncoplot)
ComplexHeatmap|根据excel表绘制突变景观图(oncoplot)本文首发于“生信补给站”:https://mp.weixin.qq.com/s/8kz2oKvUQrCR2_HWYXQT4g如果有maf格式的文件,可以直接oncoplot包绘制瀑布图,有多种展示和统计maftools | 从头开始绘制发表级oncoplot(瀑布图)和maftools|TCGA肿瘤突变数据的汇总,分析和可视化,如果只有多个样本的基因突变与否的excel,不用担心,也可以用complexheatmap包绘
2020-06-17 18:52:04
4294
原创 Tidyverse| XX_join :多个数据表(文件)之间的各种连接
本文首发于公众号:“生信补给站” Tidyverse| XX_join :多个数据表(文件)之间的各种连接前面分享了单个文件中的select列,filter行,列拆分等,实际中经常是多个数据表,综合使用才能回答你所感兴趣的问题。本次简单的介绍多个表(文件)连接的方法。一 载入数据,R包library(tidyverse)x <- tribble( ~key, ~val_x, 1, "x1", 2, "x2", 3, "x3")y <- tribbl
2020-06-04 21:49:05
1101
原创 LDheatmap | SNP连锁不平衡图(LD)可视化,自己数据实现版!
本文首发于“生信补给站”,https://mp.weixin.qq.com/s/Gl6BChxSYbSHMo9oMpufPg连锁不平衡图,用来可视化不同SNP之间的连锁程度,前同事间俗称“倒三角”图。本文使用自己的数据,因为安装R包后使用内置数据集运行出结果较容易,但是自己的数据就可能会有一些不大不小的“坑”,我替你们趟了。。。一 载入R包 数据数据为内置CEUData保存后,进行了“细微”的处理(去掉SNP碱基之间的“/”),这种基因型文件很常见;library("LDheatmap")#.
2020-05-09 10:36:04
8389
1
原创 Tidyverse|数据列的分分合合,爱恨情仇
本文首发于“生信补给站”Tidyverse|数据列的分分合合,一分多,多合一TCGA数据挖掘可做很多分析,前期数据“清洗”费时费力但很需要。比如基因列为ID的需要转为常见的symbol,基因列为symbol|ID的就需要拆开了!excel分列可以解决,但是表达量数据较大,且excel容易产生“数据变形”。一, 载入数据,R包使用TCGA下载的数据,使用以下几行几列, 作为示例lib...
2020-04-28 23:21:32
918
原创 R-ggpmisc|回归曲线添加回归方程,R2,方差表,香不香?
本文首发于“生信补给站”,https://mp.weixin.qq.com/s/_rTWJHcbUu2Eqtex74gUBA散点图绘制回归曲线很常用,那么添加上回归方程,P值,R2或者方差结果表等可以展示更量化的信息。那加起来复杂吗?还真不一定!一 载入数据和R包使用内置数据集library(ggplot2) #加载ggplot2包library(dplyr) #加载dplyr包...
2020-04-16 21:31:27
2607
原创 R|tableone 快速绘制文章“表一”-基线特征三线表
首发于“生信补给站” :https://mp.weixin.qq.com/s/LJfgxbTqsp8egnQxEI0nJg生物医学或其他研究论文中的“表一”多为基线特征的描述性统计。使用R单独进行统计,汇总,然后结果复制到excel表中,耗时耗力且易错!tableone包“应运而生”,可以非常简单快捷的解决这个问题,重点是学习成本很低,大概几分钟?一 载入数据,R包## install...
2020-03-17 12:37:59
9474
6
原创 R|生存分析 - KM曲线 ,值得拥有姓名和颜值
文章目录一 数据和R包二 原生KM曲线三 优化KM曲线1 survminer绘制KM曲线2 坐标轴,标题,主题优化3 Risk Table4 添加注释信息本文首发于“生信补给站”:https://mp.weixin.qq.com/s/lpkWwrLNtkLH8QA75X5STw生存分析作为分析疾病/癌症预后的出镜频率超高的分析手段,而其结果展示的KM曲线也必须拥有姓名和颜值!生存分析相关...
2020-03-12 21:33:06
10382
1
原创 盘一盘Tidyverse| 只要你要只要我有-filter 筛选行
首发于“生信补给站” ,https://mp.weixin.qq.com/s/l9Ci7wREQWpEV5dTvKuoHg,更多的R统计,绘图,生信,请移步????上篇根据 msleep数据集,介绍了列的操作,盘一盘Tidyverse| 筛行选列之select,玩转列操作本文盘一盘行的筛选 ????一 载入R包,数据#载入R包#install.packages("tidyverse")libr...
2020-03-02 09:55:51
1482
原创 盘一盘Tidyverse| 筛行选列之select,玩转列操作
文章首发于“生信补给站” : https://mp.weixin.qq.com/s/ldO0rm3UM_rqlFnU3euYaA2020年,开封 《R 数据科学》R for data science,系统学习R 数据处理。**在一个典型的数据科学项目中,需要的工具模型大体如下图所示。 ...
2020-01-20 10:37:29
3460
原创 barplot3d|圣诞节送你一个mutation signature搭建的“乐高”
本文首发于“生信补给站”,https://mp.weixin.qq.com/s/VNLIFzc9OysepGrE3lJrkw更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号。上次通过deconstructSigs|探寻cosmic的独特“气质”-mutation signature !学会了如何利用deconstructSigs-R包进行mutation signature...
2019-12-26 15:41:23
671
原创 deconstructSigs|探寻cosmic的独特“气质”-mutation signature !
deconstructSigs-mutation signature看一下你的数据是什么“气质”的?本文首发于“生信补给站” https://mp.weixin.qq.com/s/k7yzk9hPX3Bi-ohAo83ZYw还有其他 R统计 绘图 生信的干货,也许有需要的呢?Mutational Signatures 首次出现在2013年的nature文章Signatures of m...
2019-12-20 12:44:30
1898
1
原创 ggplot2|玩转Manhattan图-你有被要求这么画吗?
本文首发于“生信补给站”,ggplot2|玩转Manhattan图-你有被要求这么画吗?更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号。Manhattan图算是GWAS分析的标配图了,可参考Bio|manhattan图 进行绘制。由于Manhattan点太多,后期AI/PS修改的话难度有点大,如果可以“个性化”绘制的话那是极好的!一 载入R包,数据1)载入数据处理的...
2019-12-11 10:22:16
1519
原创 gganimate|创建可视化动图,让你的图表会说话
本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/kKQ2670FBiDqVCMuLBL9NQ更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号。介绍一个主要用于绘制动画的ggplot2的扩展包—gganimate包。Hans Rosling的关于“New Insights on Poverty”的TED演讲绝对是对我影响最大的几个TED...
2019-12-06 10:01:14
906
原创 ggforce|绘制区域轮廓-区域放大-寻找你的“onepiece”
首发于“生信补给站” https://mp.weixin.qq.com/s/fm69bw-3cww1YEW_kBcTHQ更多关于R语言,ggplot2绘图,生信分析的内容,关注有惊喜????。拥有财富、名声、权力,这世界上的一切的男人 “海贼王”哥尔·D·罗杰,在被行刑受死之前说了一句话,让全世界的人都涌向了大海。“想要我的宝藏吗?如果想要的话,那就到海上去找吧,我全部都放在那里。”,世界开始...
2019-11-30 10:21:01
590
原创 机器学习模型结果,合理使用
机器学习算法结合生信分析很多,作为非算法专业人士,根据模型得到的结论,敢用吗?又有哪些模型评估方法可以是我们用的稍微放心一点呢?本文主要从以下两个模型类别来介绍:评价分类结果:精准度、混淆矩阵、精准率、召回率、F1 Score、ROC曲线等评价回归结果:MSE、RMSE、MAE、R Squared一 分类算法评价1.1 预测准确性分类模型预测是否患有癌症的准确度99.9%,哇 好...
2019-11-19 13:56:53
824
原创 Broom |tidy up a bit,模型,检验结果一键输出!
本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/TqFk66F2gUu_k8WEjKbLtA更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号。lm/glm/t.test/chisq.test等模型结果,怎么提?复制粘贴还是broom?一 载入数据及R包1.1 mtcars数据集#载入内置数据集mtcarshead(mtcars)...
2019-11-19 09:42:04
1078
原创 精心整理(含图版)|你要的全拿走!(R数据分析,可视化,生信实战)
本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/ZEjaxDifNATeV8fO4krOIQ更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号。为了能更方便的查看,检索,对文章进行了精心的整理。建议收藏,各取所需,当前没用也许以后就用到了呢!一 R资料+计划R语言精品资料年中无套路赠送 R-plotly|交互式甘特图(Gantt c...
2019-11-12 09:53:05
1844
原创 R-机器学习| KNN算法
本文使用威斯康星州临床科学中心的关于乳腺癌肿瘤的数据集。一 读入数据cancer <- read.csv('breast_cancer.csv',stringsAsFactors = F)用str(cancer)观察一下数据第一例是id,第二列为diagnosis诊断类型(良性/恶性),第3-32个特征其实只包含了十个属性,但是以mean均值,standard error标准差,“...
2019-11-10 22:29:37
659
原创 ggstatsplot绘图|统计+可视化,学术科研神器
本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/zdSit97SOEpbnR18ARzixw更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号。ggstatsplot是ggplot2包的扩展包,可以同时输出美观的图片和统计分析结果,对于经常做统计分析或者生信人来说非常有用。一 准备数据gapminder 数据集包含1952到2007年...
2019-10-29 23:27:52
2230
1
原创 R-plotly|交互式甘特图(Gantt chart)-项目管理/学习计划
本文首发于“生信补给站”微信公众号,https://mp.weixin.qq.com/s/CGz51qOjFSJ4Wx_qOMzjiw更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号。甘特图(Gantt chart),又常被称为横道图或者条状图,是现代企业项目管理领域运用最为广泛的一种图示。就是通过条形来显示项目的进度、时间安排等相关情况的。项目管理外,也可以用来管理学习...
2019-10-21 22:02:27
952
原创 R-forestplot包| HR结果绘制森林图
本文首发于“生信补给站”微信公众号,https://mp.weixin.qq.com/s/2W1W-8JKTM4S4nml3VF51w更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号,给您干货。上一篇简单的介绍了COX生存分析结果绘制森林图Forest plot(森林图) | Cox生存分析可视化,本文将介绍根据数据集合的基本信息以及点估计值(置信区间区间)的结果直接绘制森...
2019-10-14 22:47:58
11795
1
原创 Forest plot(森林图) | Cox生存分析可视化
本文首发于“生信补给站”微信公众号,https://mp.weixin.qq.com/s/2W1W-8JKTM4S4nml3VF51w更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号,给您干货。Meta分析的结果使用森林图进行可视化展示很常见,其实COX生存分析也能用森林图展示。 之前分享过绘制KM曲线R|生存分析(1),诺莫图展示COX结果Nomogram(诺莫...
2019-10-08 22:52:03
3466
原创 Forest plot(森林图) | Cox生存分析可视化
本文首发于“生信补给站”微信公众号,https://mp.weixin.qq.com/s/2W1W-8JKTM4S4nml3VF51w更多关于R语言,ggplot2绘图,生信分析的内容,敬请关注小号,给您干货。Meta分析的结果使用森林图进行可视化展示很常见,其实COX生存分析也能用森林图展示。 之前分享过绘制KM曲线R|生存分析(1),诺莫图展示COX结果Nomogram(诺莫...
2019-10-08 22:49:58
10954
1
原创 ggplot2|详解八大基本绘图要素,你需要的都在这-目录版
本文首发于微信公众号 “ 生信补给站 ” ,期待您的关注!!!https://mp.weixin.qq.com/s/UMuZ1MiuKDheHk9mwA9EXA“一张统计图形就是从数据到几何对象(geometric object, 缩写为geom, 包括点、线、条形等)的图形属性(aesthetic attributes, 缩写为aes, 包括颜色、形状、大小等)的一个映射。此外, 图形中还...
2019-09-27 18:32:40
866
原创 Nomogram(诺莫图) | Logistic、Cox生存分析结果可视化
本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/BWpy3F-nEKXCdVXmY3GYZg当然还有更多R语言,生物信息学相关知识。。。????Nomogram,也常称为诺莫图或者列线图,在医学领域的期刊出现频率越来愈多,常用于评估肿瘤学和医学的预后情况,可将Logistic回归或Cox回归的结果进行可视化呈现。数据准备 使用TCGA-LIHC...
2019-09-25 09:34:15
12731
5
原创 maftools|TCGA肿瘤突变数据的汇总,分析和可视化
本文首发于公众号“生信补给站”,https://mp.weixin.qq.com/s/WG4JHs9RSm5IEJiiGEzDkg之前介绍了使用maftools | 从头开始绘制发表级oncoplot(瀑布图) R-maftools包绘制组学突变结果(MAF)的oncoplot或者叫“瀑布图”,以及一些细节的更改和注释。本文继续介绍maftools对于MAF文件的其他应用,为更易理解和重现...
2019-09-16 23:22:10
11847
12
原创 maftools | 从头开始绘制发表级oncoplot(瀑布图)
本文首发于微信公众号 “ 生信补给站 ” ,期待您的关注!!!原文链接:https://mp.weixin.qq.com/s/G-0PtaoO6bYuhx_D_Rlrlw对于组学数据的分析和展示来说,maftools算是一个宝藏“R包”,可用于MAF格式的组学数据的汇总,分析和可视化展示。 随着癌症基因组学的进步, 突变注释格式 (MAF) 被广泛用于存储检测到的somatic va...
2019-09-03 10:38:24
4401
原创 ggplot2|theme主题设置,详解绘图优化-“精雕细琢”
本文首发于“生信补给站”公众号,https://mp.weixin.qq.com/s/hMjPj18R1cKBt78w8UfhIw学习了ggplot2的基本绘图元素ggplot2|详解八大基本绘图要素,可以初步绘制出需要展示的图形,legend可以对图例进行细节的修改ggplot2 |legend参数设置,图形精雕细琢,那theme有什么用呢?theme是解决图是否美观的一个工具,其与scal...
2019-08-27 13:57:12
3835
3
原创 ggplot2 |legend参数设置,图形精雕细琢
本文首发于微信公众号“生信补给站”,https://mp.weixin.qq.com/s/A5nqo6qnlt_5kF3_GIrjIA学习了ggplot2|详解八大基本绘图要素后,就可以根据自己的需要绘制图形。前面也给出了一些ggplot2绘制生信分析基本图形的例子pheatmap|暴雨暂歇,“热图”来袭!!!ggplot2-plotly|让你的火山图“活”过来ggplot2|扩展包从0开...
2019-08-20 11:37:59
6824
转载 ggplot2|详解八大基本绘图要素,需要的都在这
本文首发于微信公众号 “ 生信补给站 ” ,期待您的关注!!!“一张统计图形就是从数据到几何对象(geometric object, 缩写为geom, 包括点、线、条形等)的图形属性(aesthetic attributes, 缩写为aes, 包括颜色、形状、大小等)的一个映射。此外, 图形中还可能包含数据的统计变换(statistical transformation, 缩写为stats),...
2019-08-13 13:41:50
5319
1
转载 使用R-ggpubr进行“paper”组图合并,也许比PS,AI更简单
本文转载自微信公众号 “生信补给站”,https://mp.weixin.qq.com/s/41iKTulTwGcY-dHtqqSnLA多个图形进行组图展示,可以既展示一个“事情”的多个角度,也可以进行异同的比较,同时也是发表论文所必须的。可以利用PS或者AI进行处理,但是图形的大小,位置,布局,字体等的调整也不是一个小工程。本文利用R包 - ggpubr 函数从0开始介绍组图的合并方式,也许...
2019-08-08 16:39:21
1300
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人