TCGA | 文献阅读 | R语言 | 数据库https://mp.weixin.qq.com/mp/appmsgalbum?action=getalbum&album_id=1338487030963142656&__biz=MzA4NDAzODkzMA==#wechat_redirect| 理论知识
今天给大家介绍一个工具FunRich,FunRich (Functional Enrichment analysis tool) 是一个主要用于基因和蛋白质的功能富集和相互作用网络分析的独立的软件工具,分析结果可以Venn图、Bar图、Column图、Pie和Doughnut等图表形式呈现,简洁清晰。用户不仅可以搜索默认的后台数据库,还可以加载自定义数据库,从而进行功能富集分析。我们前面介绍了TCGA数据库的各种数据下载与整理,获得的表达矩阵可以绘制热图,可以进差异分析,差异分析获得的差异表达基因,可以用于后续的KEGG ,GO等分析,我们这里就介绍FunRich工具,可能大家之前都用DAVID这个数据库,不妨试试FunRich这个工具,功能很强大。
一.软件下载
网址:http://funrich.org/download

该软件下载后,无需安装,解压即可使用,是不是很方便。

二.软件首页

我们后面一一介绍。
三.导入数据
点击Add dataset ,粘贴我们的基因。我们也可以导入数据集(基因集),可以是我们差异分析获得的差异表达基因【参考文章:TCGA数据库:GDCRNATools包下载数据、处理数据以及差异分析,一文就会TCGA数据库基因表达差异分析】。点击OK后,页面左侧显示输入的基因集,可以在上方对新的基因集进行命名,若不命名,自动显示为new set,new set2等,可以连续导入几个数据集。这里我们以limma包和edgeR包差异的分析结果为例。

点击Apply,我们可以看到,有些基因在数据中没有

点击OK后,如图,我导入了890个基因,数据集里面的基因名和数据库自带的背景数据集基因名可能会不符,只有761个。

点击Manage会显示符合的基因列表,可以复制下来。通过Excel中的VLOOK-UP函数与自己原基因列表比较找到不符合的基因,通过其他数据库,找到另外的基因名,再重新导入,也可以忽略。这里就忽略了。我们还可以点击Remove可以删除掉这个数据集,当然,这里就不移除了。
同样的方式,我们导入limma分析的差异基因,这样就有2个数据集啦。

四.分析
1.韦恩图绘制
点击Venn Diagram中的Venn,选择要分析的基因列表