22、因果可解释人工智能技术解析

因果可解释人工智能技术解析

1. 哈士奇与狼图像分类的反事实解释

在某些情况下,哈士奇和狼的图像很难区分,用户可能会疑惑为何某张图像被识别为哈士奇而非狼。为清晰解释二者区别,有方法提出对哈士奇图像进行修改,使分类器将其视为狼。

例如,通过交换哈士奇和狼的眼睛区域(如图中红色方块区域),分类器可能会将新的反事实图像识别为狼。这意味着如果图像按此修改(即哈士奇身体搭配狼的眼睛),标签就会是狼而非哈士奇,由此用户可识别出二者的关键区别在于眼睛。

具体而言,考虑一个图像分类器,它将图像 (I \in \mathcal{I}) 作为输入,并预测所有类别 (\mathcal{C}) 上的概率 (P(\mathcal{C}|I))。该分类器可分解为两个功能组件:一个用于特征提取(用 (f) 函数表示),另一个用于根据提取的特征做出决策(用 (g) 函数表示)。因此,所有类别标签的概率可通过 (P(\mathcal{C}|I) = g(f (I))) 计算。

给定一个被分类为 (c) 的查询图像 (I) 和一个指定类别 (c’)((c’ \neq c)),模型通过基于原始图像 (I) 和被分类为 (c’) 的图像 (I’) 设计变换来生成反事实示例 (I^{cf})。这种变换在潜在特征空间中进行,设 (\Delta) 为特征上的二进制掩码向量,反事实图像的特征定义如下:
[f (I^ ) = (1 - \Delta) \odot f (I) + \Delta \odot P f (I’)]
其中 (1) 是全 1 向量,(P) 是用于排列提取特征的置换矩阵。遵循稀疏性原则,反事实解释应在最小更改的情况下被分类为 (c’)。结合上述反事实图像的特征

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值