LIME理论分析与可解释性AI展望
1. LIME中特定命题的应用
在LIME(Locally Interpretable Model-agnostic Explanation)的理论分析里,当极限可解释系数的表达式较为简单时,将命题14.3应用到具体模型会更容易。这里主要考虑线性模型的情况,线性模型可表示为:
对于任意的 (x \in R^d),
[f(x) = \sum_{i=1}^{d} \lambda_j x_j]
其中,(\lambda \in R^d) 是固定的系数向量。在这种情况下,可以证明(Garreau和von Luxburg (2020)中的推论4),对于任意的 (j \in [d]),有:
[\beta_j = \left(\tilde{\mu} {j,b^{\star}_j} - \frac{1}{p - 1} \sum {b=1,b\neq b^{\star} j}^{p} \tilde{\mu} {j,b}\right) \cdot \lambda_j]
这里的 (\tilde{\mu}_{j,b}) 表示在第 (b) 个区间的第 (j) 维上用于采样的截断高斯分布的均值。简单来说,此时的极限可解释系数与线性模型的系数成正比。并且,在给定轴上,比例系数等于包含 (\xi) 的区间上用于采样的截断高斯分布的均值与其他区间均值的平均值之差。
有趣的是,根据上述公式,即使 (\lambda_j) 不为零,极限可解释系数也可能为零。这可能会带来问题,因为这种情况仅仅是由数据分布导致的,而非模型本身的问题。也就是说,表格LIME可能会因为 (p) 的选择使得均值“相互抵消”,从而对一个可能
LIME理论与可解释性AI分析
超级会员免费看
订阅专栏 解锁全文
903

被折叠的 条评论
为什么被折叠?



