机器学习模型解释与图像分类评估
1. 阈值调整与CEM方法概述
在预测特定被告是否会再次犯罪时,我们可以手动调整阈值。以默认的自定义阈值设置为例,如果要使误报率(FPs)大致相等,当 race_African - American = 1 时,可将阈值设为0.78。不过,这会导致该群体的漏报率(FNs)增加,无法在这方面实现平等。确定14.7%的误报率是否能解释24.4%的漏报率,需要考虑成本比率,但这需要了解相关的平均成本。
对比解释方法(Contrastive Explanation Method,CEM)结合了锚点(anchors)和反事实(counterfactuals)的元素。它用存在的部分(相关正例,Pertinent Positives,PPs)和缺失的部分(相关负例,Pertinent Negatives,PNs)来解释预测。PPs是指为预测同一类别而最小且充分存在的特征,PNs是指为预测相反类别而最小且必要缺失的特征。CEM最适用于连续和有序特征,因为它通过从特征中不断减去元素直到达到期望结果。但对于非单调连续、无序、分类甚至二元特征,CEM处理起来有困难。
CEM采用基于扰动的策略、弹性网络正则化器,还可选择使用自动编码器来引导损失函数。CounterFactualProto方法就是基于CEM论文开发的。由于CEM不依赖k-d树,当数据集较小或有噪声时,强烈建议使用自动编码器使解释更真实。
2. 自动编码器的创建与训练
训练自动编码器并不复杂,它是一个沙漏形状的神经网络,目标是使输入层和输出层匹配。中间有编码器和解码器,它们在瓶颈层汇合,瓶颈层既是编码器的输出,也是解码器的输入。整个过程
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



