人工智能/机器学习模型不确定性估计研究
1. 引言
机器学习(ML)和人工智能(AI)方法能解决传统软件开发方法难以处理的任务。近年来,深度神经网络显著提升了感知和理解相关任务的性能,因此人们希望在有安全要求的系统中使用现代ML方法。然而,数据驱动模型(DDM)如深度神经网络的行为难以预测,我们无法确保其对任何输入都能提供“正确”的结果,使用时需接受一定程度的不确定性。
当前许多DDM无法提供可靠的不确定性估计。“模型内”不确定性估计方法虽能让DDM在给出主要结果的同时提供不确定性估计,但存在局限性。例如,它们违反了“关注点分离”原则,使DDM自身负责评估其性能,导致专家难以检查不确定性估计的合理性。而且,这些估计常忽略有助于提供更好不确定性估计的特征,还可能因未校准或在训练数据上校准而过于自信。
为解决这些问题,Kläs和Sembach提出了“不确定性包装器”(UW)概念,作为一种“模型外”方法。UW不仅避免了上述问题,还能处理洋葱壳模型中考虑的三种不确定性来源,即模型拟合、数据质量和范围合规性,并且可以为不确定性估计设置置信水平,这对安全关键应用至关重要。
2. 不确定性预测的相关工作
2.1 不确定性来源
在ML领域,不确定性估计是一个活跃的研究领域。常见的不确定性来源分类有两种:
- 随机不确定性和认知不确定性 :随机不确定性是由随机性导致的不可避免的“噪声”;认知不确定性是系统性的,指原则上可知但未被考虑的现象。在具体场景中,两者的区分取决于观点,且不同建模方法的量化结果通常不可比。
- 洋葱壳模型分类 :该
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



