偏差缓解与因果推断方法解析
1. 后处理偏差缓解方法概述
在处理模型偏差时,后处理偏差缓解方法是重要的手段。以下是几种关键的后处理偏差缓解方法:
- 预测弃权(Prediction abstention) :具有公平性、安全性或控制成本等潜在好处,具体取决于问题本身。通常模型会返回所有预测结果,包括低置信度的预测。在涉及公平性时,将低置信度区域的预测改为“我不知道(IDK)”,在仅针对做出的预测评估公平性指标时,模型可能会变得更公平。也可以将预测弃权作为一种处理中方法。相关论文提出了两种实现方式,一种是训练模型选择放弃预测(学习预测 IDK),另一种是当正确的概率低于专家意见时预测 IDK。还有论文采用了“知道自己知道什么(KWIK)”的强化学习框架,该框架能自我意识到错误并允许弃权。
- 均衡赔率后处理(Equalized odds postprocessing) :也称为差异误判处理,确保特权群体和非特权群体在误分类(假阳性或假阴性)方面得到平等对待。通过找到最优概率阈值,改变标签以使群体之间的赔率相等。
- 校准均衡赔率后处理(Calibrated equalized odds postprocessing) :该方法不改变标签,而是修改概率估计,使其平均相等,这被称为校准。但无法同时满足假阳性和假阴性的公平性约束,因此需要在两者之间进行权衡。在召回率比精度更重要或反之的情况下,以及校准估计概率有好处时,这种方法具有优势。
- 拒绝选项分类(Reject option classification) :基于决策边界附近的预测
超级会员免费看
订阅专栏 解锁全文
709

被折叠的 条评论
为什么被折叠?



