5、线性回归模型的评估、解释与SHAP值应用

线性回归模型的评估、解释与SHAP值应用

1. 线性回归模型的评估与优化

1.1 模型评估指标与p值的应用

在线性回归模型中,我们可以通过计算误差分布来评估模型的性能。以下代码展示了如何计算误差分布,并返回平均绝对百分比误差(MAPE)、均方误差(MSSE)和误差分布:

Error = sns.distplot(Y - Yhat)
return MAPE, MSSE, Error

同时,p值在评估预测变量的统计显著性方面起着重要作用。p值是β系数的概率值,它表示预测变量在模型中的统计显著性。通常,我们将p值阈值设为0.05,即显著性水平为5%。如果某个预测变量的p值小于0.05,则该预测变量具有统计显著性;反之,则不具有显著性。当p值大于0.05时,β系数的值会更接近零。
在模型中,我们可以对结果数据框按照p值降序排序,以便查看每个预测变量的显著性:

resultsDF.sort_values(by='p_value', ascending=False)

对于p值大于0.05的预测变量,我们可以迭代地将其从模型中移除,以优化模型。

1.2 最终模型的构建与评估

在移除高度多重共线性变量和统计上不显著的冗余变量后,模型在训练集和测试集上的准确率仍然保持较高水平。以下是构建和评估最终模型的代码:

y = clean_df['Pri
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值