基于人工蜂群与粒子群优化的多序列比对新算法
1 引言
多序列比对(MSA)是生物信息学中的热点问题,广泛应用于序列组装、注释以及基因和蛋白质结构预测等领域。它是一个NP完全的组合优化问题,旨在发现不同序列(如核苷酸或氨基酸)之间的生物学关系,以研究其潜在特征或功能。
目前解决MSA问题的算法大致可分为四类:
- 精确比对算法:完全基于动态规划。
- 进化比对算法:利用进化算法解决MSA,如CLUSTALW软件包。
- 基于图模型的比对算法:如部分顺序比对。
- 迭代比对算法:基于能产生比对结果的算法,通过一系列迭代不断改进多序列比对,直至结果不再改善。
近年来,启发式搜索、随机优化和进化算法越来越多地用于解决MSA问题。同时,也有许多混合算法被提出,将遗传算法和进化算法相结合。然而,现有混合方法仍面临一个挑战,即如何通过整合不同的进化和启发式搜索算法来提高MSA的准确性。
为应对这一挑战,本文提出了一种新的人工蜂群与粒子群优化的混合算法(HABC - PSO)。人工蜂群(ABC)算法具有强大的全局搜索能力,但局部搜索能力较差;粒子群优化(PSO)算法则相反,具有强大的局部搜索能力,但全局搜索能力较弱。HABC - PSO算法整合了这两种算法的优势,并结合了Tent混沌搜索、基于对立学习和重组算子技术。
HABC - PSO算法考虑了两个目标函数,即带仿射间隙惩罚的加权成对和函数(WSP)和完全保守列的数量得分(TC),以保持比对的质量和一致性。为评估其准确性,使用了BAliBASE基准(版本3.0)系统,并与生物信息学领域的5种知名MSA方法以及8种进化MSA算法进行了比较。