
文章核心总结与翻译
一、主要内容
该研究聚焦深度神经网络中普遍存在的虚假相关性问题(模型依赖非因果特征如背景、纹理等进行预测,导致在无此类相关性的少数群体上泛化性能差),提出了一种无需群体标注的鲁棒性优化框架Evidential Alignment(证据对齐)。
核心背景
- 传统经验风险最小化(ERM)训练的模型易学习虚假相关性,虽整体准确率高,但在医疗、司法等高风险场景中,少数群体的预测偏差可能引发严重后果。
- 现有方法需依赖昂贵的群体标注或确定性模型,难以全面捕捉数据中的偏差模式。
方法框架(两阶段)
- 二阶风险最小化:将ERM的一阶优化扩展为分布上的分布学习,通过狄利克雷分布建模不确定性,同时输出预测概率和认知不确定性(模型不确定性),利用KL散度正则化避免过置信。
- 证据校准:基于校准数据集的不确定性估计自动计算样本权重,对误分类且高不确定性的样本(多来自少数群体)加权,仅微调模型最后一层以保留核心特征、抑制虚假相关性。

订阅专栏 解锁全文
1140

被折叠的 条评论
为什么被折叠?



