Gene set enrichment for reproducible science: comparison of CERNO and eight other algorithms
可重复性科学的基因组富集: CERNO 与其他八种算法的比较
论文摘要:
动机: 基因集(GS)富集分析是功能组学研究的重要组成部分。这里作者通过一种新方法,补充了已有的GS富集算法评估指标,以评估将GS富集测试应用于不同研究中的相关数据时,科学结果的实际可重复性。
结果:作者评估了八种已有算法和一种新算法的可重复性、敏感性、优先级、假阳性率和计算时间。除了八种已有算法外,作者还包括Coincident Extreme Ranks in Numerical Observations
(CERNO),这是一种基于修改的Fisher P-value 积分的灵活快速算法。通过使用实际数据集,证明了CERNO对排名指标、样本和GS大小具有较强的鲁棒性。CERNO具有最高的可重复性,同时保持敏感性、特异性和速度。在总体排名中,Down-weighting of Overlapping Genes的Pathway Analysis,CERNO和过表示分析表现最好,而在可重复性方面,CERNO和GeneSetTest得分较高。
可用性与实现:实现CERNO算法的tm