生物信息学入门 GEO芯片数据差异表达分析时需要log2处理的原因

首先借用一张图,通常使用limma处理时,需要经过log2后的矩阵作为表达矩阵输入。根据log2FC的定义,这个数字表示变化倍数经过log2后的一个值,比如log2FC=1,则变化为2倍;log2FC=2,则变化为4倍。这是常用的一种表述方法。

在使用limma函数计算时,如果输入的矩阵没有经过log2处理,则会把FC当成log2FC输入,这或许是因为limma默认输入的是log2后的表达式。这里有必要提到log的一个运算,即,

可见对于已经log2后的数据,计算log2FC = log2(A/B)只需要直接使用log2A-log2B。所以如果给出的是一个未经log2的数值,函数也会直接相减以得到log2FC,这就导致计算出来的差异表达高达几百甚至上千。

并且,通过RMA法进行预处理时,已经经过了log2。

但是在GEO中,一些Series Matrix File(s)仍是没有log2或者标准化,关于判断方法见下帖:

GEO芯片数据差异表达分析时是否需要log2以及标准化的问题

https://blog.youkuaiyun.com/tuanzide5233/article/details/88542558

使用GEO芯片数据通过limma包进行差异表达的教程

https://blog.youkuaiyun.com/tuanzide5233/article/details/83541443

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值