进化算法在分类与控制系统中的应用
1. 数据聚类与MDL分析
在数据聚类方面,经过2000代的聚类操作后呈现出三个聚类盒。其中最左边的聚类盒还可进一步优化,以形成更紧密的聚类,从而将离群数据点从离群盒中移除。对于三种不同的情况,“真实”数据聚类(即反映数据生成方式的聚类)的最小描述长度(MDL)分别为887、893和1025。在每种情况下,经过50次试验得到的平均最佳MDL分数分别为877.7、909.1和1004.6。在最后一种情况中,进化得到的最佳MDL实际上低于“真实”MDL,这是因为“真实”聚类存在重叠盒的劣势。
聚类时选择超盒具有一定的随意性,也可使用其他形状,如超椭圆,在相关文献中它受到了更多关注,这类似于径向基函数神经网络。将超盒和超椭圆结合的扩展方法可能会为该领域的研究做出有趣的贡献。
2. 进化分类模型
2.1 进化神经网络在乳腺癌检测中的应用
乳腺癌是女性因肿瘤死亡的第二大原因,仅次于肺癌。美国疾病控制与预防中心(CDC)数据显示,2011年美国有超过22万女性被诊断出患有乳腺癌,超过4万女性因此死亡。乳腺癌初期是可治愈的局部疾病,但在这个阶段通常无法通过触诊发现,乳腺X光检查仍是有效的筛查手段。
从20世纪90年代中期开始,神经网络被用于辅助乳腺X光检查。Fogel等人(1998)采用进化算法来优化一个固定的小型神经网络的权重。他们收集了216例可疑乳腺X光检查病例的数据,这些病例可能提示存在恶性肿瘤。随后,每位女性都接受了细针穿刺抽吸和评估,通过在特定位置取出细胞并在显微镜下检查来确定是否患有癌症。在这216例病例中,111例经活检证实为恶性肿瘤,105例活检结果为阴性。
超级会员免费看
订阅专栏 解锁全文
2033

被折叠的 条评论
为什么被折叠?



