细菌基因组分割稳健性评估与近似嵌套串联重复序列的基序比对算法
细菌基因组分割稳健性评估
在细菌基因组研究中,对基因组进行分割并评估分割的稳健性是一项重要工作。
非稳健区域的分数特征
一些可变片段的分数值几乎等于 1,这表明这些片段的估计是稳健的。但位于两个可变片段中间的主链片段的核苷酸分数接近 1,意味着在近 1000 次模拟中,它们大多被预测为可变片段,所以这个主链片段并不稳健,应归为可变片段。例如图 2C 中 S1 分割的一个可变片段,其核苷酸分数较低,约为 0.8/0.7,说明该可变片段不稳健。
片段边界的稳健性也值得关注。如图 2D 所示,一个由两个主链片段和一个可变片段组成的区域,虽然可变片段的核苷酸分数总体较高,表明该片段稳健,但片段交界处的分数曲线不如图 2A 尖锐,这意味着片段边界的核苷酸分配不如其他部分稳健,即片段间交界位置并非总能准确确定。
片段分数
片段分数为原始分割中的每个主链和可变片段赋予一个分数值,旨在便于分析整体分割的稳健性。
- S3 分割 :图 3A 展示了 S3 分割的片段分数分布,分数值分布呈现两个明显的峰值,可变片段(灰色)大多分数在 0.9 到 1 之间,主链片段(黑色)大多分数在 0 到 0.2 之间,这表明大多数可变和主链片段是稳健的,所以 S3 分割整体稳健。
- S1 分割 :图 3B 显示 S1 分割的主链和可变片段分数分布较为分散,难以区分。近三分之一的可变片段分数低于 0.8,约 20%的主链片段分数高于 0.3,说明该分割整体不稳健。
由此可
超级会员免费看
订阅专栏 解锁全文
24

被折叠的 条评论
为什么被折叠?



