作者:18届 cyl
日期:2021-08-09
论文:《A Unified Approach to Interpreting Model Predictions》
一、前言
在许多应用中,理解一个模型为什么要进行某种预测与预测的准确性同样重要。即确定每个输入特征的
重要性十分重要。
SHAP (SHapley Additive explanation,加性特征)则为每个输入特征分配了一个特定预测的重要性值。
(西瓜颜色对结果甜度的重要性)
它的新颖之处包括:
(1)确定了一类新的可加性特征重要性测度,
(2)理论结果表明,在这类测度中存在一个具有一组理想性质的唯一解。
(3)SHAP统一了6个现有的方法。
二、原理
2.1 目标
定义一个更为简单的模型作为原始模型的任何可解释的近似。
2.2 公式
1、设f为待解释的原始预测模型,g为解释模型。
2、基于单个输入x的预测f(x), 3、解释模型通常使用简化的输入x 0,通过映射函数x = hx(x 0)映射到原始输入,
4、局部方法在z0≈x0时尽量确保g(z0)≈f(hx(z0))
5、
6、其中 的均值为SHAP值(对输入自己的所有可能组合求均值)
三、SHAP优势
3.1 局部精度

本文围绕论文《A Unified Approach to Interpreting Model Predictions》展开,介绍了SHAP方法。SHAP为每个输入特征分配重要性值,具有确定新测度、统一现有方法等新颖之处。文中阐述了其原理、优势,如局部精度、一致性等,还对该方法进行了评估,通过实例证明其有效性。
最低0.47元/天 解锁文章
9807

被折叠的 条评论
为什么被折叠?



