5、线性回归模型的评估、解释与SHAP值应用

最新推荐文章于 2025-11-24 22:00:50 发布

bean

最新推荐文章于 2025-11-24 22:00:50 发布

阅读量82

点赞数

CC 4.0 BY-SA版权

分类专栏： Python实现可解释AI模型文章标签：线性回归模型评估 SHAP值

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/bean/article/details/149550530

Python实现可解释AI模型专栏收录该内容

19 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

线性回归模型的评估、解释与SHAP值应用

1. 线性回归模型的评估与优化

1.1 模型评估指标与p值的应用

在线性回归模型中，我们可以通过计算误差分布来评估模型的性能。以下代码展示了如何计算误差分布，并返回平均绝对百分比误差（MAPE）、均方误差（MSSE）和误差分布：

Error = sns.distplot(Y - Yhat)
return MAPE, MSSE, Error

同时，p值在评估预测变量的统计显著性方面起着重要作用。p值是β系数的概率值，它表示预测变量在模型中的统计显著性。通常，我们将p值阈值设为0.05，即显著性水平为5%。如果某个预测变量的p值小于0.05，则该预测变量具有统计显著性；反之，则不具有显著性。当p值大于0.05时，β系数的值会更接近零。
在模型中，我们可以对结果数据框按照p值降序排序，以便查看每个预测变量的显著性：

resultsDF.sort_values(by='p_value', ascending=False)

对于p值大于0.05的预测变量，我们可以迭代地将其从模型中移除，以优化模型。

1.2 最终模型的构建与评估

在移除高度多重共线性变量和统计上不显著的冗余变量后，模型在训练集和测试集上的准确率仍然保持较高水平。以下是构建和评估最终模型的代码：

y = clean_df['Pri

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。