Comparative Study on gene set and pathway topology-based enrichment methods
基于基因集和通路拓扑的富集方法对比研究
论文摘要:
背景:富集分析是一种流行的方法,可以识别在差异表达基因背景下显着富集的通路或基因集。传统的基因集富集方法将通路视为简单的基因列表,无视任何基因或蛋白质相互作用的知识。相反,新的所谓基于通路的方法将通路的拓扑结构整合到分析中。
方法:我们比较研究了基于基因集和通路拓扑的富集方法,考虑了三种基因集和四种拓扑方法。在两项广泛的模拟研究和36个真实数据集的基准上对这些方法进行了比较,为所有方法提供了相同的路径输入数据。
结果:在基准数据分析中,两种类型的方法均表现出可比的检测富集通路的能力。在第一次模拟研究中,使用了KEGG pathways,这种通路考虑了基因之间的重叠。在原始KEGG通路的这项研究中,基于拓扑的方法都不优于基因集方法。因此,在第二次模拟研究中,使用由唯一基因IDs构成的非重叠通路。这里,与基因集方法相比,通路拓扑计算方法具有更高的精度,但其灵敏度较低。
结论:我们针对基于通路拓扑结构的富集方法进行了第一次全面的比较工作,以评估基因集。**拓扑方法在具有非重叠路径的模拟场景