机器学习模型的公平性与设计模式
1. 模型公平性评估与优化
1.1 模型性能与公平性分析
通过性能与公平性图表,我们可以看到不同特征值下模型的表现。例如,在贷款审批模型中,HUD 监管的贷款审批准确率显著高于非 HUD 贷款,分别为 94% 和 85%。但从混淆矩阵来看,非 HUD 贷款的批准率更高,达到 72%,而 HUD 贷款为 55%,这可能是由于数据表示偏差导致的。
1.2 优化策略:调整分类阈值
可以通过改变模型的分类阈值来优化模型的公平性。例如,我们需要确定一个置信阈值,当模型对贷款申请的批准置信度超过该阈值时,才将其标记为“批准”。这个决策很大程度上取决于模型的上下文和预测任务。
以下是不同场景下阈值选择的示例:
| 场景 | 置信阈值 | 原因 |
| — | — | — |
| 图像中是否有猫的预测 | 60% | 即使置信度较低,也可以接受返回“猫”的标签 |
| 医学图像中是否有疾病的预测 | 较高(如 98%) | 需要更高的置信度以确保准确性 |
The What-If Tool 可以帮助我们根据各种优化目标选择合适的阈值。例如,优化“Demographic parity”可以确保模型对 HUD 和非 HUD 贷款的申请批准率相同;使用“equality of opportunity”公平指标可以确保测试数据集中真实值为“批准”的 HUD 和非 HUD 数据点被模型预测为“批准”的机会相等。
1.3 其他公平性评估方法
改变模型的预测阈值只是处理公平性评估指标的一种方法,还有其他方法,如重新平衡训练数据、
超级会员免费看
订阅专栏 解锁全文
1119

被折叠的 条评论
为什么被折叠?



