HiOmics云平台有300+个分析工具,除了常见的GO\KEGG等富集分析工具外,HiOmics云平台还有GSEA工具!
链接:https://www.henbio.com/tooldetail?id=417
基因集富集分析(Gene Set Enrichment Analysis, GSEA):是一种用来确定一组先验定义的基因集是否在两种生物状态之间显示出统计学上显著的、一致的差异计算方法。
GSEA分析计算原理
GSEA分析主要包括以下三个关键步骤
1. 计算富集得分(Enrichment Score, ES):富集得分用于衡量特定基因集在排序后的基因列表中的分布情况。
具体计算方法是:在基因列表中逐步扫描,每遇到基因集中的基因时,根据其在列表中的位置赋予一个权重值(通常与基因的差异表达程度相关),并累加这些权重值,最终得到富集得分。
富集得分的大小反映了基因集在排序列表中的富集程度,正值表示基因集在列表顶部富集,负值表示基因集在列表底部富集。
2. 估计富集得分的显著性水平:为了判断富集得分是否具有统计学意义,需要通过排列检验(Permutation Test)来估计其显著性水平。
具体操作是:随机打乱样本标签多次(如1000次),重新计算每次打乱后的富集得分,从而构建一个富集得分的背景分布。
将实际计算得到的富集得分与背景分布进行比较,计算出其在背景分布中的位置,从而得到p值,用于评估富集得分的显著性。
3. 多重假设检验校正:在GSEA分析中,通常会同时对多个基因集进行富集分析,这会导致多重假设检验问题。
为了解决这一问题,需要对得到的p值进行校正,常用的方法是Benjamini-Hochberg校正(FDR校正)。
通过校正后的FDR(False Discovery Rate,假发现率)值,可以更准确地评估基因集富集结果的可靠性,避免因多重检验而导致的假阳性结果。
GSEA分析原理概述
1. 输入数据:GSEA分析需要输入两组样本的基因表达量数据。
2. 差异基因分析:通过比较两组样本的基因表达量,找到差异表达基因。
根据Fold change(对数变化倍数)对差异基因进

最低0.47元/天 解锁文章
2065

被折叠的 条评论
为什么被折叠?



