20、多目标算法在生物数据挖掘中的应用探索

多目标算法在生物数据挖掘中的应用探索

在生物信息学领域,挖掘复杂生物数据中的有价值信息一直是一项具有挑战性的任务。本文将介绍两种重要的技术方法:多目标进化算法用于发现肽结合基序,以及进化多目标概念聚类方法用于挖掘结构数据库,同时对它们的性能和应用进行分析。

多目标进化算法发现肽结合基序

在寻找肽结合基序的研究中,多目标进化算法(MOEA)展现出了独特的优势。

实验基序的得分矩阵表示

为了将实验基序以定量矩阵的形式呈现,采用了特定的评分方案。排除了两个不能很好描述k - 聚体位置或对描述位置分配较少残基的实验基序。对于其他基序,具体评分规则如下:
- 所有不容忍的位置得分为0。
- 耐受性良好的残基被赋予最大得分127。
- 主要锚定位置的首选残基被赋予最大得分的一半。
- 未携带任何预定义残基的位置被赋予最大得分的三分之一。

计算每个得分矩阵之间的距离,并将所有距离的总和用于优化目标函数f2。

多目标进化算法NSGA - II参数设置

在MOEA优化运行中,使用了包含500个个体的种群,每个个体代表180个介于0和127之间的实数。具体参数设置如下:
- 实数变量的交叉概率设置为1.0。
- 变异概率为0.006。
- 交叉和变异的分布指数分别设置为15和30。

经过300代后,进化过程终止。算法收敛到最终种群的情况如图1所示。多个帕累托解的存在允许用户选择最佳解,我们从基序解集里选择了在测试数据集上具有最高AROC(受试者工作特征曲线下面积)的基序。

性能比较

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值