基于化学反应优化和分类器的乳腺癌预测
1. 引言
乳腺癌如今已成为全球女性中最为常见的癌症之一。当乳腺细胞不受控制地生长和分裂,形成组织团块即肿瘤时,就可能引发乳腺癌。2020年,有68,500名女性死于乳腺癌,230万女性受到影响。乳腺癌有多种类型,如浸润性导管癌、三阴性乳腺癌、炎性乳腺癌等,且每年仅有15% - 20%的乳腺癌能得到确诊。它存在良性和恶性两个阶段,还有诸多症状和体征。
为改善乳腺癌的分类情况,本文引入了一种乳腺癌预测方法,不仅考虑了常规因素,还纳入了一些导致乳腺癌的外部影响因素。通过对医疗数据进行预测分析,可以做出许多独特决策并形成预测。近年来,为给患者提供合适治疗并提高生存率,研究人员开始将机器学习(ML)技术应用于生物医学领域,ML技术也因此成为这类研究的常用工具。
此前已有不少研究人员运用多种应用程序来诊断乳腺癌,部分研究者使用威斯康星乳腺癌(WBC)数据集和决策树、朴素贝叶斯、支持向量机(SVM)等机器学习方法。本文的目标是比现有相关方法取得更好的结果,采用了SVM、决策树、XGBoost和随机森林等不同的ML方法来预测癌症类型,同时使用基于群体的元启发式算法——化学反应优化(CRO)来优化特征数量。
2. 相关工作
- Siham A. Mohammed等人 :提出了一种使用不同机器学习技术进行乳腺癌检测分析的方法。他们使用顺序最小优化、决策树和朴素贝叶斯三种分类器来提高准确率,并比较了威斯康星乳腺癌(WBC)数据集和另一个乳腺癌数据集。在数据预处理中处理了不平衡数据和缺失值,采用十折交叉验证。未应用预处理技术时,决策树在两个数据集上的准确率分别为75.52%
基于CRO和分类器的乳腺癌预测
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



