数值数据预测:回归方法及保险业务应用
1. 线性回归模型性能评估
在进行线性回归分析时,我们得到的模型结果通常具有一定的逻辑意义,但我们还不清楚模型对数据的拟合程度如何。为了评估模型性能,我们可以使用 summary() 命令对存储的模型进行分析。例如,对于存储的保险费用预测模型 ins_model ,可以使用以下代码:
summary(ins_model)
该命令的输出可以分为三个主要部分,用于评估模型的性能:
1. 残差部分(Residuals) :提供了预测误差的汇总统计信息。残差等于真实值减去预测值,最大误差为 231252 表明模型至少对一个观测值的费用预测低了超过 230,000 美元。而大部分误差是相对较小的负值,这意味着我们对大多数参保人的费用进行了高估,这也是保险公司能够承担高额事故费用的原因。
2. 回归系数的 p 值(Pr(>|t|)) :对于每个估计的回归系数,p 值给出了在给定估计值的情况下,真实系数为零的概率估计。较小的 p 值表明真实系数不太可能为零,即该特征与因变量极有可能存在关系。部分 p 值后面带有星号( ),对应着指定估计值达到的显著性水平。p 值小于显著性水平的变量被认为具有统计学意义。我们的模型中有几个高度显著的变量,且它们与结果的关系符合预期。
3. *多重 R 平方值(Multiple R-squared) :也称为决定系数,用于衡量模型
回归方法在保险中的应用
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



