参考文献:Chen, Z., Bei, Y. & Rudin, C. Concept whitening for interpretable image recognition. Nat Mach Intell 2, 772–782 (2020). https://doi.org/10.1038/s42256-020-00265-z
项目代码链接:https://github.com/zhiCHEN96/ConceptWhitening
1. 概括
这篇文章提出了一个叫做Concept Whitening(CW)的模块,翻译作“概念白化”。CW模块能够将深度神经网络的隐空间解耦合,并且赋予每个维度一个人为定义的“概念”。加入了CW模块的深度神经网络在性能上没有很大的差别,但是具有了更好的可解释性。
2. 概念 Concept
所谓的概念,可以理解成原始数据当中提取出来的初级特征。例如,对于一个图片场景分类的任务,终极的特征是图片当中的场景,而初级特征可以是图片当中所包含的物品、人物等。理论上来说,根据一张图片中出现的物品种类,是可以推测出图片当中的场景的。我们把这种初级特征,就叫做“概念”。本篇文献的一个假设就是,经过学习后的深度神经,可以提取出原始数据中的“概念”,并根据所提取出的“概念”进行分类任务。也就是如下图所示:

3.概念在隐空间中的表征
假设我们有这样一个深度神经网络函数fff,它在X=Rn\mathcal{X}=\mathbb{R}^nX=Rn上有定义,它的值分布在Y=Rm\mathcal{Y}=\mathbb{R}^mY=Rm。现在我们把这个网络拆分成浅层和深层部分:f=g∘Φf=g\circ\Phif=g∘Φ,其中Φ\PhiΦ是浅层部分,ggg是深层部分。那么我们将会得到一个新的空间:Z=Φ(X)\mathcal{Z}=\Phi(\mathcal{X})Z=Φ(X)(严格来说,应该是Φ(X)∈Z\Phi(\mathcal{X})\in\mathcal{Z}Φ(X)∈Z,因为Φ(X)\Phi(\mathcal{X})Φ(X)不一定能够铺满整个Z\mathcal{Z}Z空间)。这个空间是X\mathcal{X}X变换到Y\mathcal{Y}Y的一个中间态,我们称其为隐空间。再接下来的讨论里面,我们假设dim(Z)=ddim(\mathcal{Z})=ddim(Z)=d.
现在有这样一个分类器训练问题,即给定一批样本D={ xi,yi}i=1N\mathcal{D}=\{x_i,y_i\}_{i=1}^ND={ xi,yi}i=1N,其中xi∈Xx_i\in\mathcal{X}xi∈X,而yiy_iyi是表示类别序号的整数,一共有MMM种类别。要求通过这些样本,将神经网络函数fθf_\thetafθ训练成为一个分类器。我们首先假设,所有的xix_ixi,都是X\mathcal{X}X空间上的概率密度分布p(x)p(x)p(x)的采样。而对于所有的yi=j∈[1,M]y_i=j\in[1,M]yi=j∈[1,M],xix_ixi都是X\mathcal{X}X空间上的类条件概率密度分布pcj(x)=p(x∣cj)p_{c_j}(x)=p(x|c_j)pcj(x)=p(x∣cj)的采样。
现在我们人为的规定出kkk个概念(k<dk<dk<d),分别是c1,...,ckc_1,...,c_kc1,...,ck. 我们按照数据是否含有对应的概念,从集合{ xi}i=1N\{x_i\}_{i=1}^N{ xi}i=1N里抽取元素,构造出kkk个子集X1,X2,...,XkX_1,X_2,...,X_kX1,X2,...,Xk. 其中对于任意xix_ixi,若xix_ixi含有概念cjc_jcj,则xi∈Xjx_i\in X_jxi∈Xj,否则xi∉Xjx_i\notin X_jxi∈/Xj.
在以上这些前提假设之下,我们希望经过一定算法训练之后的神经网络fff,它的隐空间Z\mathcal{Z}Z要具有对概念的表征能力。也就是要满足这样一个假设:
假设3.1:隐空间Z\mathcal{Z}Z上存在一组基E={ e1,e2,...,ed}E=\{e_1,e_2,..., e_d\}E={ e1,e2,...,ed},对于每一个zi=Φ(xi),xi∈Dz_i=\Phi(x_i), x_i\in \mathcal{D}zi=Φ(xi),xi∈D

本文介绍了ConceptWhitening(CW)技术,这是一种用于深度神经网络的模块,旨在提高模型的可解释性。CW通过将隐空间解耦合并赋予概念意义,使网络能够在保持性能的同时增加透明度。文章详细阐述了概念在隐空间中的表征、白化算法及其目标坐标系的构建,以及CW模块的训练和更新策略,强调了CW如何帮助理解和解析模型决策过程。
最低0.47元/天 解锁文章
1260

被折叠的 条评论
为什么被折叠?



