- 5.5 用类似于BLAST的比对工具快速搜索基因组DNA
- 需求:随着基因组DNA数据库数量增长,对比对工具要求越来越高
- 能在基因组DNA中找到外显子
- 比对时考虑基因组DNA包含的测序错误
- 有相应的算法解决相关物种的基因组在比对中出现删除、重复、倒置或移位的问题
- 有相应的算法解决DNA序列之间的小差异,如SNP位点
- 用标准集去评估基因组比对效果
- 时使用序列进化随机模型(ROSE)软件包船舰一个模拟序列集进行测试,可以得到全局比对工具LAGAN灵敏度最高,局部比对工具(如BLASTZ)在编译区段的比对更加精确
- PatternHunter:非连续的种子提高灵敏度
- PatternHunter在匹配位点中间加入错配位点,提升了速度与灵敏度(描述了两种模型)
- 以匹配为1,错配为0为例,模型格式如下:
- BLASTN:11111111111
- PatternHunter:110100110010101111(另一种11101001010
- 需求:随着基因组DNA数据库数量增长,对比对工具要求越来越高