线性回归与多元回归模型的构建、训练和验证
线性回归模型的统计检验
在进行线性回归分析时,我们首先要确定变量之间是否存在显著关系。通过统计检验,我们可以判断斜率是否为零,从而确定变量之间是否有关联。
-
t - 统计量和 p - 值检验
- t - 统计量 :t - 统计量用于检验斜率是否等于零。在我们的例子中,临界值为 2.83 和 - 2.83,t - 统计量值为 - 7.68,落在拒绝域内。这意味着我们拒绝原假设(斜率等于零),接受备择假设(斜率不等于零),表明每加仑英里数和马力之间存在关系。
- p - 值 :我们使用 p - 值方法进行检验。查找 7.68(绝对值)和 21 自由度对应的值,α 值设为 0.01。为了拒绝原假设,p - 值需小于 0.01。我们发现 p - 值小于 0.001,由于我们希望拒绝域在钟形曲线的两侧,所以将 0.001 乘以 2,得到 p - 值为 0.002。因为 0.002 小于 0.01,所以我们拒绝原假设,接受备择假设,即斜率不等于零。
-
计算 r - 平方(决定系数)
- r - 平方是决定系数,它表示数据集的 Y 值(每加仑英里数,蓝色点)和模型计算的 Y’ 值(每加仑英里数,灰色线)相对于 Y 的平均值(红色线)的分离程度。
- 决定系数的计算公式为:$r^2 = \frac{Explained Vari
超级会员免费看
订阅专栏 解锁全文
1067

被折叠的 条评论
为什么被折叠?



