Lambda3:高效的局部比对搜索工具
1. 引言
在生物信息学领域,对序列进行局部比对搜索是一项重要任务。比较翻译后的序列(蛋白质空间)往往能揭示出在DNA序列中难以发现的同源性。这是因为某些DNA变化对蛋白质功能影响较小或无影响,所以在蛋白质空间进行比较更有可能发现有意义的同源关系。此外,蛋白质数据库通常注释更完善,结果更具实用性,而且跨物种蛋白质数据库规模相对全基因组数据库更小,使得某些搜索在蛋白质数据库中更可行。
目前,BLAST是最流行的局部比对搜索工具,它不仅开发了相关程序,还制定了评估局部比对匹配显著性的统计方法,被广泛接受和应用。然而,随着数据量的不断增长,BLAST的速度问题变得日益突出。许多基于比对的方法中,BLAST步骤占据了大部分运行时间。因此,人们一直在努力开发更快的算法和工具,以在不牺牲太多准确性的前提下替代BLAST。
在LAMBDA发布之前,已经有一些BLAST的替代工具,如BLAT、UBlast、RAPSearch2和PAUDA等。LAMBDA于2014年发布,它是第一个使用双索引的局部比对工具。下面将详细介绍LAMBDA的发展历程、实现方式以及相关特点。
2. 前期工作
2.1 BLAST工具
BLAST有多种程序模式,不同模式的查询字母表和主题字母表有所不同,具体如下表所示:
| BLAST模式 | 查询字母表 | 主题字母表 |
| — | — | — |
| BlastN | 核苷酸 | 核苷酸 |
| BlastP | 氨基酸 | 氨基酸 |
| BlastX | 翻译后的核苷酸 | 氨基酸 |
| TBlas
超级会员免费看
订阅专栏 解锁全文
41

被折叠的 条评论
为什么被折叠?



