生物信息学中的进化计算与基因调控网络建模
1. 进化计算在模型和参数优化中的应用
1.1 变异操作
在进化计算(EC)中,变异操作是一种重要的搜索方式,不同的数据结构有不同的变异方法:
- 对于二进制字符串,随机“翻转”一位。
- 对于更复杂的结构,随机选择一个位点,删除与该位点相关的结构,并随机创建一个新的子结构。
有些 EC 方法仅使用变异(无交叉,如进化策略),通常,变异用于在“局部搜索空间”中进行搜索,通过允许基因型的微小变化,有望带来表型的变化。
1.2 GA 优化特征集和模型的一般过程
GA(遗传算法)可用于优化特征集和模型,具体步骤如下:
1. 从初始特征集 (G_m) 和模型 (M) 开始,创建 (K) 个染色体(模型)的种群,每个染色体具有来自 (G_m) 的不同特征子集,以及与模型 (M) 参数值略有不同的参数值。染色体包含一个二进制部分(表示特征在模型中是否存在,存在为 1,不存在为 0)和一个连续值部分(模型的参数)。例如,若模型是 ECF ECOS,参数包括 (R_{max})、(R_{min})、模糊隶属函数的数量、ECF 模型的训练迭代次数。
2. 进行 (P) 代的循环:
- 从数据集 (S) 中随机选择一个子集 (S_{tst}) 用于测试,其余 (S_{tr}) 用于训练。
- 在 (S_{tr}) 上训练所有 (K) 个模型,并在 (S_{tst}) 上进行测试。
- 选择最佳模型(如具有最大准确率的模型)。
- 对染色体应用交叉验证和变异操作,创建下一代的 (K) 个新模型。
3. 选择最终的最佳模型(具
超级会员免费看
订阅专栏 解锁全文
245

被折叠的 条评论
为什么被折叠?



