目录
1 SW算法介绍
Smith-Waterman 算法是由 Temple F. Smith 和 Michael S. Waterman 两人在 1981 年提出来的,是 Needleman-Wunsch 算法的改良版,通过算法的比对,能获取到局部最优解。具体的算法这里不做过多解释,详见参考文献[1]。本文关注的主要问题是,计算速度的问题。尽管网上有很多SW算法的实现,有Java、Python和R包。然而,当在计算大量的序列相似性时,以上代码的实现会非常的慢,甚至需要月余。如果使用C语言实现代码,效果非常明显但是可扩展性不高。考虑到以上两个因素,Python下的Cython库是一个非常好的实现方式,可以实现Python和C语言的混合编程。
2 ssw_aligner环境配置
### Dependencies
- [numpy==1.12.0](http://www.numpy.org/)
- [Cython==0.28.3](https://cython.org/)
3 项目安装地址
https://github.com/mbreese/swalign
4 项目实例
from ssw_aligner import local_pairwise_align_ssw
query_seq = 'TTTTTAAAAA'
target_seq = 'GGGGTTTT'
alignment = local_pairwise_align_ssw(query_seq,
target_seq,
gap_open_penalty=11,
gap_extend_penalty

本文介绍了Smith-Waterman算法的基本原理,重点讨论了如何利用Cython进行Python和C语言混合编程,以解决大规模序列比对的计算速度问题。通过ssw_aligner项目实例,展示了如何使用该工具进行高效本地配对,并提供了基准测试和输入要求。
最低0.47元/天 解锁文章
7487

被折叠的 条评论
为什么被折叠?



