杂交定位测序的复杂性
在生物技术和人类基因组计划中,测序问题至关重要。杂交测序(SBH)作为一种有潜力的替代传统凝胶测序的方法,在八十年代末被提出并获得专利。本文将深入探讨杂交定位测序(PSBH)的复杂性,特别是在每个子串允许的位置数量受限的情况下。
1. 杂交测序(SBH)概述
SBH的基本思想是通过DNA芯片确定目标序列中所有k - 长的子串(k - 元组),然后尝试从这些子串重建目标序列。实际应用中,k值通常在8到10之间。SBH的核心计算问题是从序列的谱(即所有包含在序列中的k - 元组及其重数的列表)重建序列。
一种简单的方法是在有向图中寻找哈密顿路径,其中图的顶点对应谱中的k - 元组,当一个顶点的(k - 1) - 后缀等于另一个顶点的(k - 1) - 前缀时,两个顶点相连。但这是一个计算上困难的问题。Pevzner证明了可以将重建问题转化为在另一个有向图中寻找欧拉路径,这是一个容易解决的问题。在这个图中,顶点对应(k - 1) - 元组,对于谱中的每个k - 元组,一条边连接对应其(k - 1) - 长前缀和后缀的顶点。
然而,SBH的主要缺点是解的歧义性。图中的分支(即从同一个顶点出发的两条或更多条边)表示存在多个替代解。除非分支数量非常少,否则很难确定正确的序列。理论分析和模拟表明,使用8 - 元组芯片唯一可重建序列的平均长度仅约为200,远低于商业凝胶测序仪的单次读取长度。
2. 杂交定位测序(PSBH)的提出
由于测序问题的重要性和SBH的数学优雅性,许多作者提出了改进SBH的方法,包括替代芯片设计和交互式协议。最近,一些作者提出了基于在谱中添加位置信息的SBH增强方法,即杂交定位测序(PS
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



