生物信息学入门使用 GEO基因芯片数据进行差异表达分析（DEG）——Limma 算法数据代码结果解读

ntuYision

于 2018-10-30 23:49:14 发布

阅读量7.8w

点赞数 73

分类专栏： R 生物信息学文章标签：差异表达 DEG limma 生物信息学 R语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/tuanzide5233/article/details/83541443

版权

差异表达分析通常作为根据基因表达矩阵进行生物信息学分析的第一步，有助于我们观察基因在不同样本中的表达差异，从而确定要研究的基因和表型之间的联系。常用的基因表达数据来自基因芯片或高通量测序。虽然矩阵看起来差不多，但是由于服从不同的分布，因此在进行差异表达的时候需要用不同的方法。对于一般的生命科学领域科研人员来说，了解晦涩的算法并没有太大价值。本文力求精简，从数据——算法——结果三个方面给出最简单的示范。注意：文中代码仅适用于基因芯片的counts数据！使用的是limma算法！

基于TCGA的FPKM数据进行差异表达的算法可以参考：（还没写，过几天补充）

1.数据准备

数据准备包括表达矩阵和分组矩阵。

表达矩阵：

分组矩阵

第一列为样本名称，第二列为组名称，注意每一列都要有列名

2. 使用Limma包进行差异分析

首先要安装limma包和gplots包

source("http://bioconductor.org/biocLite.R")
biocLite("Limma")
biocLite("gplot

最低0.47元/天解锁文章

评论 35

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。