先来感受下整理好数据格式上传数据后仅需1秒的极速出图流程和一键修改配色功能,各项性能遥遥领先,视频为证,先睹为快:
本次复现的图表来源于Nature metabolism(IF=10.569)题目为《Single-cell profiling of vascular endothelial cells reveals progressive organ-specific vulnerabilities during obesity,译:血管内皮细胞的单细胞分析揭示了肥胖过程中器官特异脆弱性》中的Figure 2o-分组聚类热图。跟着操作,只需要简单的鼠标点点点3步骤,在短暂3分钟内即可轻松复现该图。大家如果有类似数据分析需求或类似实验设计产生的数据可以按照平台上示例数据格式(模板)直接复制粘贴替换成自己数据直接分析哦!
NC原图(上) VS CNSknowall复现结果(下)
CNSknowall完美复现文献原图,聚类结果(左侧各基因间的连线)、所有方格的颜色深浅与原图完全一致,仅基因从上到下的顺序不同但对结论毫无影响。另外我们复现结果加标注每个格子上log(FC)的值,呈现更全面信息,在复现的基础上进一步优化和升华。
复现目标图片介绍
--- ·分组聚类热图· ---
聚类热图常用于呈现多样本基因的差异性表达(RNA-Seq),通过使用颜色由深至浅的变化来清晰地展示多个样本中基因的表达量高低。本质是利用matrix中两两值的相关系数作为依据,对多组值进行层级聚类。利用差异基因的表达值绘制聚类热图,来查看基因在不同样本中的表达差异情况,或者比较不同聚类分组之间的差异。分组热图,指在聚类热图的基础上添加分组功能,并将分组标签在分组格子内显示,以便在热图的基础上展示更多信息。
作者对进行正常饮食(chow diet)和西方饮食(WD diet)小鼠的脑、心脏、肺、肾脏、肝脏、内脏脂肪组织(Vis AT)和皮下脂肪组织(Sc AT)共7个主要器官中分离出的内皮细胞【分为三类,包括动脉和小动脉(art,a),毛细血管(cap,c)和小静脉(ven,v)】进行scRNA-seq测序,用分组(大分组是7个器官,每个器官都含a、c和v3个亚组)聚类热图对7个器官中的a,c和v的差异基因进行可视化展示,发现和正常饮食组相比,西方饮食的小鼠肝脏(Liver)的Fabp1基因表达量增加,以及脂肪组织(包括vis AT和Sc AT)的art(a)和ven(v)中Fabp4、Cd36、Fabp5、Dbi和Lpl基因表达量增加。从而证明了肥胖引发肝脏cap内皮细胞中肝脏特异性脂肪酸转运体Fabp1的表达增加,同时引起脂肪组织中art和ven中脂肪酸转运体Fabp4、Cd36、Fabp5、Dbi和Lpl的表达增加。
原文 Figure 2o
详细复现步骤
分组聚类热图
1
登录CNSknowall
文末点击“阅读原文”直达(或复制链接到浏览器上收藏)进入平台:http://cnsknowall.com/index.html#/HomePage
登录后进入:数据分析➡高阶分析➡热图➡分组聚类热图
2
数据下载(可选)
【注:由于CNSknowall平台的本分组聚类热图模块用的示例数据即本文的Source Data Fig.2数据,大家如果不想自己下载和整理数据可以直接上传示例数据,一键复现作者的原图】
从原文下载Source Data数据,原文链接:https://www.nature.com/articles/s42255-022-00674-x
原文Source Data Fig.2数据位置如下,点击下载到本地:
用Excel打开后可以看到Figure 2o的Source Data数据如下:
将上述下载的数据整理成下图的格式:
数据一:将文献数据中的“NA”替换成“0”,其中第一行为样本ID,第一列为基因ID,表中的数值为每个样本的基因FPKM值或经过标准化处理(可以用本平台中的“高阶分析-数据处理-数据归一化/标准化处理”模块对原始数据进行标准化处理)后的数值等。
数据二:定义分组信息。第一列为样本名,其余2列为样本所在的组名,按顺序在图中从上到下展示。
3
上传数据
参数选择:
本模块“参数选择”包括8种层次聚类方法和5种距离计算方法,详见“说明”。根据文章内容,将层次聚类方法设置为“single”,距离计算设置为"euclidean"。在实际操作过程中,可根据需求选择合适的方法。
数据上传:
根据数据类型,直接将表格上的示例数据一和示例数据二清空后进行复制粘贴替换,点击上传(本模块的示例数据即原文数据,可直接上传分析一键复现)。
上传成功后,页面上方会显示弹窗信息,“已上传成功”。
点击开始做图后,等待平台运行。
个性化设置:
如下图所示,在"图形设置"➡"图例设置"➡"图例范围"中修改图例范围为“-0.5”-“0.5”,与原文保持范围一致,即可得到1:1复现的分组聚类热图。
再次比较下原图和本平台的复现结果:
NC原图(上) VS CNSknowall复现结果(下)
CNSknowall复现结果
4
图形设置
除上述个性化设置外,该工具也提供了一些其他个性化设置,如图表设置,标签设置等。
01
图形颜色设置
全网首创的一键随机变色模式,遥遥领先:
全网最大气的调色板任意自选颜色:
输入精准的颜色参数:
首次将取色器用于医学数据分析,一键复制相中文献上的配色风格:
02
图表设置
在图表设置中,可修改边框、数值等
03
标签设置
在标签设置中,可分类标签字体、颜色等
5
结果下载
最后直接下载出可满足SCI发表像素(>300dpi)的图片。本工具有四种图片格式可供下载(建议首选PDF),可根据需要,自行选择。以下载pdf格式的图片为例,点击“下载图片”➡“Download PDF",即可完成下载,下载后的矢量pdf可以进一步编辑各个细节如字体大小和格式、移动标签位置等。
输出PDF格式后借助WPS的编辑功能,可以进一步修改字体大小、加粗、移动字体位置、添加文字进行更精细调整。
END
点击关注我们,用最短的时间和最高的效率学习更多数据分析方法!
由于CNSknowall平台过于火爆,1群已满,新开2群。
火速进群,升级打怪,会晤道友,结识道侣!
注册登录CNSknowall后即可无限制任意免费使用
--一次性收藏120个皆可一键出图的高级通用生信工具--
同时收藏42个柱状图+23个饼图+其余70个各类常用图表
写在后面:AI时代已来,您需要非同以往的更强数据分析工具
CNSknowall (中文:CNS万事通)平台是今年1月份新上线的一款专门针对医学领域的创新型免费在线数据分析云平台,和目前常用的数据分析工具如SPSS、Origin、GraphPad Prsim和R语言相比,CNSknowall在数据上传、配色修改和参数调整等各方面做出了一系列重大创新,各项性能遥遥领先,几乎没有任何学习成本(包括时间成本和金钱成本),甚至优于GPT(毕竟GPT不是专门的数据分析工具)。您只需要简单的套用平台提供的固定数据格式复制粘贴替换成自己的数据,鼠标点点点就可以完成CNS级别的高水平图表制作,可以让不擅长或没接触过数据分析的人以最短的时间内快速建立医学数据分析的基本思维,以最快的速度掌握各种数据分析技能,帮助大家在数据分析上节省大量宝贵的时间,从而可以把时间和精力用在更重要的事情比如查阅文献和设计研究思路方案等,提高文章发表速度,减缓毕业焦虑,赋能职业生涯,开启科研天骄之路!
CNSknowall 首页
很多时候知道自己要画什么图往往比会画什么图更重要
平台包含300个数据分析模块,您可以快速找到能让自己数据价值最大化的分析方法