机器学习模型解释方法:Anchors与Shapley值
1. Anchors方法
1.1 基本概念
Anchors方法用于解释任何黑盒分类模型的个体预测。它通过寻找一个决策规则,该规则能“锚定”预测结果,即其他特征值的变化不影响预测。此方法结合强化学习技术和图搜索算法,减少模型调用次数,降低运行时间,同时能从局部最优解中恢复。
与LIME类似,Anchors采用基于扰动的策略为黑盒机器学习模型的预测生成局部解释。不同的是,LIME使用代理模型,而Anchors的解释以易于理解的IF - THEN规则形式呈现,即“锚点”。这些规则具有可重用性,因为它们包含覆盖范围的概念,明确适用于其他可能未见过的实例。
1.2 示例说明
以预测泰坦尼克号乘客是否幸存的二元黑盒模型为例,假设要解释某特定个体幸存的预测原因。该个体的特征信息如下:
| Feature | Value |
| ---- | ---- |
| Age | 20 |
| Sex | female |
| Class | first |
| TicketPrice | 300$ |
| More attributes | … |
| Survived | true |
对应的Anchors解释为:
IF SEX = female
AND Class = first
THEN PREDICT Survived = true
WITH PRECISION 97%
AND CO
超级会员免费看
订阅专栏 解锁全文
168

被折叠的 条评论
为什么被折叠?



