机器学习可解释性

本文介绍了机器学习中的可解释性,重点讨论模型无关方法,如PDP(部分依赖图)和ALE(累积局部效应图),以及基于样本的SHAPLEY值方法。PDP用于分析特征取值变化对模型预测的影响,而ALE则解决了PDP在连续特征上的问题。SHAPLEY值提供了一种评估单个特征对预测贡献的方式。虽然sklearn库已支持PDP,但在线性模型中使用可能失去意义。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


关于机器学习可解释性方面的研究,有位大佬做了一份很好的总结。

Interpretable Machine Learning.
在这里插入图片描述
同时国内也有人翻译了中文版 可解释的机器学习_中文版,不过大家条件允许的话还是先看原文把。
想要了解可解释性的详细概念以及具体一些方法的推导和说明的话可以直接看书,本文仅记录使用这些方法的一些情况。

模型无关方法

LR和决策树之类的模型是很好解释的,看LR对应特征的参数以及决策树的划分属性都容易被人们理解;相反一些集成模型和神经网络(CV可以考虑激活图或者Attention,结构化数据就有点麻烦)就不怎么好理解了,所以就有一些和模型无关的,通用的方法提出来了。

PDP

部分依赖图(PDP)是一种分析特征取值发生变化时,利用模型预测概率的变化来反馈特征的重要程度。
比如某特征有A,B两种取值,我们分别把所有样本的取值换成A和B,送入训练好的模型中得到不同取值下样本的平均预测概率就可以做个比较。当然有可能出现这样无法区分的数据。
在这里插入图片描述
对于连续属性的话,类似决策树划分属性时操作,为每一个出现的取值做一个计算,最后拟合成一个折线图就是所谓的部分依赖图了。
很让人高兴的就是

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值