生物信息学中氨基酸替换矩阵与肽结合基序的研究进展
在生物信息学领域,氨基酸替换矩阵的确定以及肽结合基序的发现一直是重要的研究方向。本文将介绍一种新的确定氨基酸替换矩阵的方法,以及使用多目标进化算法(MOEA)来发现肽结合基序的研究。
新的氨基酸替换矩阵确定方法
传统的氨基酸替换矩阵在序列比对等生物信息学任务中起着关键作用。而新提出的方法则具有独特的思路。
该方法首先对所考虑的残基字母表进行集合覆盖,然后构建一个无向图,图中节点的邻近关系代表残基的可交换性。所需的替换矩阵是该图中加权距离的函数。确定边的权重,以及如何将得到的加权距离转换为替换矩阵元素,是一个优化过程的结果。这个优化过程基于一组参考序列比对进行,并输出与替换矩阵一起使用的空位成本。
具体来说,优化问题是明确界定的。给定将覆盖集转换为边权重以及将加权距离转换为替换矩阵元素的参数化函数形式,问题是要找到能在参考比对集上最大化某个目标函数的参数值和空位成本。研究中使用遗传算法作为优化方法,并以BAliBASE套件作为所需参考比对的来源进行了计算实验。
从目前的结果来看,即使在实际进行任何优化之前(即基于遗传算法之前的随机参数实例化),新方法也能够产生性能与许多已知矩阵相当的替换矩阵。这表明该方法是一种有原则的确定替换矩阵的方式,它将与氨基酸结构和物理化学性质相关的所有努力都集中在寻找合适的集合覆盖上。在有限的设置中,该方法还能产生优于其他测试矩阵的替换矩阵。不过,要使这一结论在更广泛的场景中成立,取决于遗传算法的运行效率。幸运的是,遗传过程本质上适合并行处理且具有高度可扩展性,这主要取决于能为该工作聚集多少处理器。此外,还需要研究替代的函数形式和参数范围来设置优化问题,以及考虑其他目
超级会员免费看
订阅专栏 解锁全文
1107

被折叠的 条评论
为什么被折叠?



