生物信息中的FPKM counts TPM是什么意思 名词解释

FPKM 是 “Fragments Per Kilobase of transcript per Million mapped reads” 的缩写,一句话翻译:

把原始读段数(counts)先按基因长度、再按测序深度做两次“归一化”,使得
不同基因、不同样本之间可以横向比较表达量高低。


为什么要归一化?

  1. 长基因更容易被测到,counts 天然偏高;
  2. 测序深度高的样本 counts 整体偏大;
  3. 直接比 counts 会得出“长基因、深测序 = 高表达”的假结论。

FPKM 通过两步校正消除这两类偏差:

  1. Per Kilobase
    把 counts 除以基因长度(kb),抵消“长基因优势”。
  2. Per Million
    把结果再除以“百万比对读段数”,抵消“测序深度差异”。

公式(直观版)

FPKM =  counts ÷ (基因长度 kb) ÷ (总比对 reads / 1 000 000)

与 TPM 的区别(面试常问)

  • FPKM 先“长度”后“百万”
  • TPM 先“百万”后“长度”
    → TPM 保证每个样本内部表达量总和相同,跨样本比较更直观;
    FPKM 仍受样本间总 reads 差异影响,但历史沿用多(Cufflinks 时代)。

回到你的代码

dat_fpkm <- dat_fpkm[rownames(dat_counts),]

这一步就是把 归一化后的表达矩阵(FPKM)与 过滤完的 counts 矩阵 按基因行名对齐,保证后续差异分析、富集、可视化都用同一批基因。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值