MEMSA与Fly算法:生物信息与医学成像的创新解决方案
1. Parisian进化方法与MEMSA算法
传统的多序列比对(MSA)方法存在一个问题,它们试图进化代表完整MSA的个体,然而由于序列比对存在多种有效方式,这在概念上是一项不可能完成的任务。因此,使用全局方法意味着要在适应度函数上做出选择。
Parisian方法借鉴了学习分类器系统的Michigan方法,旨在将一个大问题分解为多个小的子问题,这些子问题的解决难度比全局问题低几个数量级,然后再将子问题重新组合成全局解决方案。在Parisian方法中,个体仅代表解决方案的一部分,在算法的最后阶段,从各个个体部分重建全局解决方案。这种方法有两个优点:一是降低了MSA算法的计算要求,因为比对被分解为更小的子问题,意味着可以快速构建和评估更小的个体;二是解决了MSA没有唯一全局适应度函数的问题,不同的蛋白质区域可以使用不同的适应度函数。
基于Parisian方法的进化算法MEMSA进化代表良好“补丁”的个体,而不是完整的解决方案,这些补丁可以根据不同的全局评估进行不同的重新组合。
2. 基于Parisian方法的MSA遗传算法
2.1 个体/补丁
在MEMSA中,个体代表局部比对,称为“补丁”,包含来自不同序列的少量相同长度(至少2个氨基酸)的“片段”。
2.2 初始化
与人工进化通常的做法一样,初始化使用随机值(在约束范围内)以避免偏差。初始种群中的每个个体由从2 - 5个序列中提取的2个氨基酸的短片段组成。
2.3 交叉
在运行算法时发现,具有超过2个片段的良好个体非常罕
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



