21、机器学习中的公平性定义与数据审计

机器学习中的公平性定义与数据审计

在机器学习领域,确保模型的公平性至关重要。公平性不仅关乎模型的准确性,还涉及到社会的公平与正义。本文将介绍多种公平性的定义和衡量方法,以及如何使用开源工具进行数据审计和质量检查。

公平性的定义与衡量指标
  • 等效准确性指标 :一个好的预测合格分数意味着参赛者有一个好的合格分数,而低的预测合格分数则表示参赛者的合格分数较低。但当由于性别偏见,低预测分数的男性参赛者获得好的合格分数时,这个指标就不满足了。例如,男性和女性参赛者的阳性预测值(PPV)分别为 0.73 和 0.74,阴性预测值(NPV)分别为 0.49 和 0.63。
  • 总体准确性平等 :要求分类器确保受保护和不受保护的群体具有相等的预测准确性。数学上可表示为 (P (d = Y, G = m) = P (d = Y, G = f))。该指标允许男性和女性之间存在微小差异,例如两组的总体准确率分别为 0.68 和 0.71。
  • 处理平等 :该指标确定分类器的错误比率,而不是考虑其准确性。它确保受保护和不受保护的群体具有相等的假阴性和假阳性比率(FN/FP),例如男性和女性参赛者的该比率分别为 0.56 和 0.62。
公平性指标 定义 示例
等效准确性指标 预测分数与实际合格分
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值