10、利用 SHAP 解释集成模型和分类模型

bean

于 2025-07-13 09:14:37 发布

阅读量222

点赞数

CC 4.0 BY-SA版权

分类专栏： Python实现可解释AI模型文章标签： SHAP 机器学习模型解释集成模型

本文链接：https://blog.youkuaiyun.com/bean/article/details/149550542

Python实现可解释AI模型专栏收录该内容

19 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

利用 SHAP 解释集成模型和分类模型

在机器学习中，对模型预测结果进行解释是非常重要的，它可以帮助我们理解模型的决策过程，增强模型的可信度。本文将介绍如何使用 SHAP（SHapley Additive exPlanations）库来解释不同类型的机器学习模型，包括集成分类模型、分类提升模型、多分类分类提升模型以及 LightGBM 模型。

1. 集成分类模型：SHAP 与成人数据集

首先，我们使用经典的成人数据集（Adult dataset），这是一个常见的收入普查分类数据集，因其易于理解且常出现在机器学习示例代码中而广受欢迎。

import shap
import sklearn

# 加载成人数据集
X_adult, y_adult = shap.datasets.adult()

# 训练简单的线性逻辑回归模型
model_adult = sklearn.linear_model.LogisticRegression(max_iter=10000)
model_adult.fit(X_adult, y_adult)

上述代码加载了成人数据集，并训练了一个逻辑回归模型，这是一个二分类问题。

为了进一步分析，我们定义了两个函数，分别用于计算预测概率和对数赔率比：

def model_adult_proba(x):
    return model_adult.predict_proba(x)[:,1]

def model_adult_log_odds(x):
    p =

订阅专栏解锁全文

会员秒杀 ¥9.9 重磅福利

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

bean

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

订阅专栏

机器学习模型解释性工具SHAP

医疗影像检索

09-11

3313

如下图，SHAP支持模型解释性，可用于抽取特征对结果的贡献。 Github地址：https://github.com/slundberg/shap 案例： 1、数据集： # dataset：http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_diabetes.html # diabetes 是一个关于糖尿病的数据集，该数据集包括442个病人的生理数据及一年以后的病情发展情况。 # 数据集中的特征值总.

SHAP可视化解释机器学习模型简介

阿文(alvin)的专栏

09-25

1672

本文主要参考自https://blog.youkuaiyun.com/chaishen10000/article/details/128319250。

参与评论您还未登录，请先登录后发表或查看评论

使用CatBoost和SHAP进行多分类完整代码示例

deephub

07-16

6085

本文的示例展示了CatBoost的强大功能，它可以轻松创建一个良好的评分模型。但是更重要的是我们展示了SHAP在分析模型特征方面的强大功能。它允许我们从许多不同的角度来看特征，而不是我们可以用普通的EDA和相关性来探索。它确实名副其实的附加解释，可以通过模型进行预测建模，让我们深入了解特征本身。作者：lochie links。

Shap解释Stacking多分类模型（全套代码分享）

weixin_43470958的博客

03-04

2490

Shap解释Stacking多分类模型

【机器学习】解释你的机器学习模型！以力导向图可视化随机森林分类器的SHAP值为例

未来就在脚下。

12-30

9473

在机器学习领域，理解模型是至关重要的一环。SHAP（SHapley Additive exPlanations）是一个强大的工具，可用于解释模型的预测结果。本文将介绍如何使用SHAP库解释随机森林分类器的预测结果。

可解释机器学习模型：解释SHAP分析的非技术指南

LonghaoJia的博客

05-17

1万+

随着可解释性成为机器学习项目越来越重要的要求，越来越需要将SHAP等技术的复杂输出传达给非技术利益相关者。

SHAP模型：可解释机器学习模型

热门推荐

是小陈的笔记

08-24

4万+

小白进阶选手，如果写的内容有什么问题大家一起讨论学习呀：）模型介绍首先个人理解SHAP模型是对机器学习模型进行解释的一个模型上面这个图就是一个比较直观的解释 机器学习模型一般都是一个黑盒。比如某个模型要进行一些预测任务，首先对模型输入一些已知条件（Age=65,Sex=F,BP=180,BMI=40），然后模型根据输入进行训练，最终训练完的模型可以对该条件输出预测结果（Output=0.4）所以这样模型只能得到最终的结果，至于模型内部是怎么计算的，输入的已知条件（...

CatBoost集成模型助力分类任务，解释变量与shap - 机器学习

08-29

内容概要：本文介绍了CatBoost与SHAP集成模型在分类任务中的应用，通过Python代码实现模型构建与可解释性分析。使用CatBoost进行分类建模，结合SHAP方法解释模型预测结果，揭示各特征对输出的贡献程度。代码包含数据...

CatBoost-SHAP集成模型在分类任务中的应用与解释：Python代码实现及可视化

07-30

内容概要：本文介绍了CatBoost-SHAP集成模型在分类任务中的应用及其解释方法。CatBoost作为一种基于梯度提升决策树的算法，特别适用于处理分类任务，而SHAP则用于解释模型预测结果，帮助理解模型的重要特征和变量。...

机器学习中CatBoost-SHAP集成模型在分类任务的应用与解释

05-13

内容概要：本文介绍了CatBoost-SHAP集成模型在分类任务中的应用及其解释方法。CatBoost作为一种基于梯度提升决策树的算法，在处理分类任务时表现出色，尤其擅长处理带有类别特征的数据集。SHAP（Shapley Additive ...

XGBoost结合SHAP应用：回归、二分类、多分类模型

weixin_45520028的博客

10-09

1万+

引言 XGBoost用于建模，SHAP用户模型的可视化解释。 XGBoost原理参考推荐： https://zhuanlan.zhihu.com/p/75217528 SHAP原理参考推荐： https://blog.youkuaiyun.com/weixin_45520028/article/details/108857908 XGBoost建模 1 数据准备 1 数据准备 2 数据处理 2 数据处理 3 XGB模型 3 XGB模型 4 模型评估 4 模型评估 XGBoost使用笔记 1 XGBoost模型参数解释

XGBoost多分类模型实例（结合SHAP解释）

weixin_45520028的博客

10-10

1万+

【教程】SHAP值解释xgboost模型的特征重要性-SofaSofa

SofaSofa_io的博客

05-11

1万+

利用SHAP解释Xgboost模型 Xgboost相对于线性模型在进行预测时往往有更好的精度，但是同时也失去了线性模型的可解释性。所以Xgboost通常被认为是黑箱模型。 2017年，Lundberg和Lee的论文提出了SHAP值这一广泛适用的方法用来解释各种模型（分类以及回归），其中最大的受益者莫过于之前难以被理解的黑箱模型，如xgboost和神经网络模型。本教程中，我们在真实数据集上进行实操...

用shap模型可解释来选择特征

katyZhong的博客

04-14

2232

https://github.com/slundberg/shap

机器学习模型的解释-SHAP

weixin_41851055的博客

05-18

1万+

数据监控SHAP值 SHAP值 SHAP值基于Shapley值，Shapley值是博弈论中的一个概念。SHAP所做的是量化每个特征对模型所做预测的贡献。对于所有的特征上图可以自由组合共有2^3=8种可能（数学中称为power set即幂集）。SHAP需要为幂集中的每个不同的组合训练一个不同的预测模型，这意味着有8个模型。当然，这些模型在涉及到它们的超参数和训练数据时是完全等价的。唯一改变的是模型中包含的一组特征。假设上图是已经用相同训练样本训练了8个线性回归的模型。我们可以用这8个模型分别对一个测试样

三分类SHAP图（特征标准化之后怎么画）

芝士不禁脑汁

11-23

7117

画三分类SHAP图出错今天干了一件很蠢的事情，还耽误了很多时间，特此记录一下我将数据标准化之后训练模型，然后将未标准化的数据作为输入计算了SHAP值，得出的结果显然不对。类似于下图这种但是如果画图时将X_test输入作为参数，那么横坐标就对应的是标准化之后的值，所以我们可以先对X_test未经标准化时候制作一个copy版本X_test1，然后作为画图时候参数输入就可以正确画出SHAP图的横坐标了，也可以得到我们想要的信息。另外三分类shap values得到一个3维数据，有时候使用起来需要切片，比如

shap解释模型特征，多张图保存的实现（要改源码

得道者

06-16

1万+

原始的shap一般是直接show出特征，需求是保存多张图，做特征变化的对比直接改shap.summary_plot源码可以实现函数参数增加save=False,path=False 在summary_plot函数最下面增加 if save: pl.savefig(path) pl.close() 这里必须要close掉图层，要不然会出现多层叠加的问题直接使用代码 explainer = shap.TreeExplainer(mode

针对连续三次转子故障的四旋翼增量被动容错控制.zip