基于性能指标和赤池信息准则的机器学习算法选择框架
一、引言
随着互联网的发展,数据呈现爆炸式增长,从大数据中提取信息的技术也日益重要,这些技术可用于制定营销策略、提升产品和服务价值以及个性化用户体验。近年来,人工智能(AI)、机器学习(ML)和深度学习(DL)领域备受关注,其应用范围广泛,涵盖了从家庭到医院、从个人到企业、从农业到军事等各个方面。
本文聚焦于机器学习方法在医疗保健、市场营销和电信三个领域的应用。在医疗保健领域,重点研究了心血管疾病和胎儿健康两个问题。心血管疾病是印度乃至全球最严重的疾病之一,2016 年全球因心脏病死亡人数超过 1760 万,占总死亡人数的 28.1%。因此,准确、早期地诊断和治疗此类疾病需要一个高精度、高一致性的预测系统。胎儿健康分类则是判断胎儿是否健康。在医疗保健领域,共使用了三个数据集(两个心血管数据集和一个胎儿健康数据集)。
本文提出了一个机器学习算法选择框架,该框架基于数据集属性、性能指标和赤池信息准则(AIC)来选择合适的算法。为了进行实验,将机器学习算法分为急切学习器、懒惰学习器和混合学习器三类,并从三个领域(医疗保健、电信和市场营销)选取了八个数据集进行实验。模型推荐基于性能评估参数(准确率、精确率和召回率)以及模型选择参数(AIC)。
二、机器学习应用
机器学习在各个领域都有潜在的应用,以下是其在医疗保健、电信、市场营销等领域的应用概述:
- 医疗保健领域
- 疾病预测与诊断 :如 Panigrahi 等人开发了基于专家系统的临床决策支持系统(CDSS)用于预测和诊断乙型肝炎;Islam 等人
超级会员免费看
订阅专栏 解锁全文
2000

被折叠的 条评论
为什么被折叠?



