基于关联规则挖掘方法解释时间序列CNN分类器
在深度学习领域,可解释性是一个重要的研究方向。本文将介绍三种关联规则挖掘(ARM)方法,用于解释时间序列数据上的卷积神经网络(CNN)分类器,并对它们的性能进行评估。
1. 规则正则化方法(RuleReg)
在主模型训练期间,RuleReg通常为每个训练批次构建一个新的替代模型。通过以下函数计算指标 (N_{\rho}):
[N_{\rho}(\theta) = 1 + \sum_{(A,\hat{y})\in\rho} |A|]
该指标对所有规则列表的前件数量进行求和。但由于它不可微,不能直接用于成本函数,因此使用代理函数来近似它。实际的损失函数为:
[L’‘(\theta,D) = \lambda \cdot S_{\varphi}(\theta) + L(\theta,D)]
其中,(\lambda) 是正则化强度。代理函数的输入是在主模型训练期间收集的主模型参数向量及其从替代模型 (N_{\rho}) 获得的相应复杂度。
替代模型使用大小为 (N) 的数据集 (D’ = {(x’ i,M {\theta}(x_i))}_{i=1}^{N}) 进行拟合,其中数值特征因规则挖掘算法(如SBRL)的要求被转换为分类特征。主模型和替代模型成功训练后,替代模型会生成一个人类可模拟的替代规则列表,用于解释模型的预测。
2. 基尼正则化方法(GiniReg)
GiniReg与RuleReg类似,也是一种正则化技术,旨在为深度神经网络拟合一个全局替代模型以提高可解释性。但它只训练一个替代模型,并且使用一个可微的正则化项来惩罚不均匀的预测。
超级会员免费看
订阅专栏 解锁全文
1381

被折叠的 条评论
为什么被折叠?



