实用的EST与人类基因组比对软件
1 EST与基因组比对算法
1.1 单外显子比对算法
对于将表达序列标签(EST)与单外显子进行比对的算法,具体步骤如下:
从L + 1到N - L的每个i,将f(i - 1) + 1赋值给f(i)。这一步被称为延伸步骤,因为每次迭代会在该外显子的末尾添加一个核苷酸。
1.2 多外显子EST处理算法
为了处理具有多个外显子的EST,当外显子延伸失败时,会加入跳过内含子的过程,具体步骤如下:
1. 识别一个外显子 :当EST中的第i个核苷酸与基因组中的第f(i)个核苷酸相匹配时,设置f(i) = f(i - 1) + 1,并将i加1。
2. 搜索下一个外显子 :由于步骤1已确认外显子在EST的第i个核苷酸处终止,因此以E[i, i + L - 1]作为主键,通过参考映射表来检测下一个外显子的位置。确定下一个外显子的位点后,将f(j)(j = i, …, i + L - 1)设置为相应值,然后将i增加L,并返回步骤1。
1.3 允许比对中存在错配和缺口
在实际操作中,任何EST都无法以100%的同一性完全比对,从而导致比对中出现错配或缺口。为了处理这些错配和缺口,对算法进行了修订,允许EST中的ei与基因组中第f(i)位置的不同核苷酸错配,或者当ei被跳过并与缺口相关联时,f(i)未定义。在这种一般情况下,如果EST序列的前缀E[1, L](或后缀E[N - L + 1, N])可能包含错配或缺口,则无法检测到EST在基因组序列中的起始和结束位置。为了解决这个问题,可按以下步
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



