【富集分析GSEA】如何理解富集分析以及应用

富集分析

文章:Subramanian et al. 2005 论文《Gene Set Enrichment Analysis: A Knowledge-Based Approach for Interpreting Genome-Wide Expression Profiles》

GSEA 方法的数学原理、富集分数(ES)计算及统计检验

GSEA(Gene Set Enrichment Analysis,基因集富集分析)是一种用于基因表达数据分析的方法,旨在评估 预定义基因集 在 基因表达排序列表 中是否富集。其核心数学原理涉及 富集分数(Enrichment Score, ES) 计算、显著性检验 及 多重假设校正。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

进一步解释

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

不同的方式

  1. 直接使用疾病特征进行富集分析(不翻转上调和下调的基因)
    目的:如果你的目标是了解疾病状态的生物学特征和功能路径,那么应该直接使用疾病特征(包含疾病状态下上调和下调的基因)进行富集分析。
    解释:通过这种方式,你可以识别疾病状态下的显著通路和功能,例如疾病相关的信号通路、分子功能或细胞过程。这将帮助你理解疾病特征性变化背后的生物学机制。
    适用场景:这通常用于研究疾病的致病机制和生物学背景。例如,想要找到哪些通路在疾病状态下异常活跃或受抑制时,可以直接对疾病特征进行富集分析。
  2. 将疾病特征翻转后再进行富集分析
    目的:如果你的目标是筛选或评估潜在的治疗药物,可以考虑先将疾病特征翻转(即上调基因变为下调,下调基因变为上调),再使用翻转后的基因集合进行富集分析。
    解释:翻转后的基因集合相当于一个理想的“健康或治疗”状态特征,代表药物在逆转疾病特征时的目标表达模式。通过富集分析,可以评估哪些药物基因特征与这种“理想状态”匹配,从而判断药物是否可能对疾病有效。
    适用场景:这种方法在药物筛选或寻找疾病干预手段时更为常见。研究者可以将翻转后的疾病特征与药物诱导的基因表达数据进行比较,寻找可能使基因表达恢复至健康状态的候选药物。

参考文献

[1]GSEA法基因功能富集分析原理详解!
[2]GSEA原理的通俗易懂的理解
[3]GSEA背后的统计学原理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值