并行GPU算法在生物序列比对及热传导系数求解中的应用
1. 引言
在2010年11月的全球超级计算机500强榜单中,部分计算机采用了英伟达(NVidia)的GPU。针对GPU设计的算法被应用于各种问题,其中一些涉及生物信息学领域。本文主要探讨了约束多序列比对(CMSA)问题以及人工蜂群算法(ABC)在逆热传导问题中的应用。
2. 约束多序列比对问题
- 基本概念
- 设集合$S = {S_1,S_2,\cdots,S_k}$中的所有序列都基于有限字母表$\Sigma$,$\Sigma$中的元素称为符号,序列$S_i$的长度用$n_i$或$|S_i|$表示,$s_{i}^{j}$表示$S_i$的第$j$个符号。
- 两个序列$S’$和$S’‘$的比对定义为一对等长序列,可通过在$S’$和$S’‘$的某些位置插入特殊符号“–”(称为空位)得到。给定距离函数$\delta(x,y)$($x,y \in \Sigma \cup {-}$),两个长度为$n$的序列$S’$和$S’‘$的成对得分定义为$\sum_{1\leq j\leq n}\delta(s_{j}’,s_{j}’‘)$,其中$\delta(x,-) = \delta(-,x) = w_g$($w_g$为空位成本)。
- 集合$S$的多序列比对(MSA)是一组可能插入空位的等长序列$S = {S_1,S_2,\cdots,S_k}$。本文使用最流行的成对求和(SP)方法来衡量多序列比对的质量,总MSA得分是所有序列对的序列比对得分之和:$\sum_{1\leq i’<i’‘\leq k} \s