机器学习算法在职业健康评估与人员图像识别中的应用
在当今科技飞速发展的时代,机器学习算法在各个领域都展现出了巨大的潜力。本文将探讨机器学习算法在职业健康评估以及人员图像识别两个不同但又都极具现实意义的领域中的应用。
职业健康评估中的机器学习算法应用
在职业健康评估领域,我们旨在筛选出可能在工作中面临职业病或受伤风险增加的求职者。为此,我们选择了入职职业健康评估数据作为通用模型,样本量为 15,677 个。
数据准备
原始数据包含诊断、医疗记录和建议等信息,但存在大量缺失值。221 个变量中,只有 14 个变量没有缺失值,仅有 50 个(22.6%)变量的缺失值比例在 15% 或以下。我们考虑了包括肺功能、肌肉骨骼、听力和实验室评估等在内的职业健康核心评估项目,剔除了这些关键组件中有缺失值的记录。
特征选择
尽管数据集中提供的变量数量众多,但最终用于预测模型的特征大幅减少。我们先减少数据集规模,然后选择没有缺失值的特征。最后,通过启发式特征选择,保留了以下变量:“年份”、“ID”、“性别”、“年龄”、“工作类型”、“右耳听力测试”、“左耳听力测试”、“双侧听力损失”、“肺功能测试”、“体重指数”、“血红蛋白”、“葡萄糖”、“总胆固醇”、“肌肉骨骼状况”。为了构建模型,我们使用 One-hot-encoding 算法将包含分类值的列转换为数值值。
结果筛选
综合文献回顾显示,不到 0.6% 的患者被评估为医学上不适合其工作职责。因此,我们选择并筛选出两种工作适应状态:适合工作和适合工作但需建议。这两种状态的分布较为平衡,分别占 33.2%(n = 882)和 66.8%(n
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



