嵌套串联重复序列的基序比对问题解析
在生物信息学领域,对串联重复序列的研究一直是一个重要的课题。嵌套串联重复序列(NTRs)的基序比对问题更是其中的关键。本文将深入探讨该问题的相关概念、解决方案以及算法的正确性和扩展性。
1. 问题背景与相关工作
在对NTRs的分析中,通常分为两个阶段。第一阶段是扫描序列并检测候选NTRs,然后构建形成NTR的两个共识基序X和x。第二阶段是验证阶段,需要将假定的NTR与所有形式为$xs_0Xt_0xs_1Xt_1 \cdots xskXtk$的模式进行比对。这种比对对于确定NTR的范围和结构(即找到上述的指数$s_i$和$t_i$)非常重要,同时也可用于评估模板基序x和X的适配性。
此外,还存在变体比对问题,即对齐具有相同或相似基序的两个不同NTR,以了解它们共享的进化历史。而解决基序比对问题是解决变体比对问题的必要前提。
为了解决序列相似性问题,已经有许多算法被提出。在编辑距离下的字符串相似性算法是近期研究的热点,其中动态规划(DP)技术是一种常见的获得最优解的方法,该方法使用的评分函数对最终的比对输出起着关键作用。
过去研究过不同的比对问题,例如:
- 一些研究了两个完整字符串A和B的比对;
- 另一些研究了字符串A和B的子串比对;
- 还有研究了字符串B在字符串A中的所有出现情况;
- 以及寻找字符串T中与$xs$($s > 1$)的子串最匹配的子串问题。
Fischetti等人引入的环绕动态规划算法具有$O(mn)$的时空复杂度,被不同的串联重复查找程序用于验证和生成最终报告。不过,标准的串联重复软件通常无法找到NTR的多个波段。不同
超级会员免费看
订阅专栏 解锁全文
940

被折叠的 条评论
为什么被折叠?



