基因表达水平估计与基因组岛预测的研究进展
在基因研究领域,准确估计基因表达水平以及有效预测基因组岛对于理解基因功能和疾病机制至关重要。下面将详细介绍相关的研究方法和成果。
基因表达水平估计
- DGE - EM 算法优势 :DGE - EM 是一种用于从 DGE 标签推断基因特异性表达水平的新型期望最大化算法。它在统一的统计模型中考虑了可变剪接异构体和在基因组中多个位置映射的标签,还能纠正不完全消化和测序错误。与基于唯一标签计数的常用估计方法相比,DGE - EM 在真实和模拟数据实验中表现更优。在测序成本归一化后,其准确性与最先进的 RNA - Seq 估计算法相当,在无错误的合成数据上甚至更胜一筹。
- DGE - EM 与 Uniq 算法对比 :Uniq 算法根据与同一基因的同工型中的一个或多个切割位点匹配的标签数量来量化基因表达,这些标签相对于源基因是唯一的。通过比较 Uniq 和 DGE - EM 在 HBRR 样本库 4 中的准确性,当允许的错配数在 0 到 2 之间变化时,仅计算完全匹配的标签时,Uniq 获得最佳准确性,因为错配数增加会使标签的歧义性增加,减少唯一标签的数量。在 0 个错配的情况下,DGE - EM 已经优于 Uniq,但由于不能容忍测序错误,准确性提升有限。允许每个标签有 1 个错配时,所有比较方法中 DGE - EM 获得最佳准确性,但将错配数进一步增加到 2 时,准确性低于仅使用精确匹配的情况,可能是因为数据的错误率远低于 10%,过多的错配引入了过多的标签歧义。
- DGE 和 RNA - Seq 协议比较
超级会员免费看
订阅专栏 解锁全文
51

被折叠的 条评论
为什么被折叠?



