机器学习在肥胖预测与通胀驱动因素分析中的应用
肥胖预测研究
在健康领域,肥胖问题日益受到关注,尤其是针对特定人群的肥胖预测研究具有重要意义。本次研究聚焦于农村女性肥胖问题,运用机器学习算法进行深入分析。
评估指标与数据处理
在机器学习模型评估中,有几个关键指标用于衡量模型性能:
- 分类准确率 :用于衡量正确分类的案例比例。
- 灵敏度 :衡量被分类为阳性的阳性案例的比例。
- 特异度 :衡量被分类为阴性的阴性案例的比例。
- Cohen’s kappa统计量 :用于处理多类和不平衡类问题,衡量预测和实际分类之间的一致性,值范围在小于等于1之间,不同取值范围有不同的一致性描述,如<0为“无一致性”,0 - 0.20为“轻微”等。
研究中,将70%的个体样本作为训练数据集,剩余30%作为测试数据集进行验证,所有模型基于R中的caret包进行十折交叉验证训练。
特征选择与模型比较
通过Boruta算法进行特征选择,从20个属性中选出5个与预测肥胖相关的变量,分别是年龄(Age)、教育水平(EducLevel)、地理位置(Location)、水源(WaterSource)和卫生设施(ToiletFacility)。
使用这些选定变量构建了六个机器学习模型,比较它们的性能,结果如下表所示:
| 模型 | 准确率(%) | 灵敏度(%) | 特异度(%) | Kappa | 平衡准确率(%) | <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



