线性模型与相关方法的深入解析
1. 线性模型基础
在数据分析中,线性模型是一种常用的工具。通过最小化实际值与预测值之间的平方差之和来计算估计系数。以预测为例,预测值与实际值的误差经过平方处理后求和,而线性模型的目标就是找到合适的参数,使得这个平方和最小。这就是最小二乘法估计,有时也被称为普通最小二乘法。
1.1 线性模型的有效性诊断
线性模型的线性假设较强,其有效性需要进行评估。
1.1.1 精确性问题
没有一个模型是完全精确的。例如,在预测球员体重与身高的关系时,即使回归函数的线性近似不完全准确,但在预测方面仍可能表现良好。而且,回归函数给出的是某一身高球员的平均体重,个体球员的体重数据点不一定完全落在直线上。
1.1.2 诊断方法
多年来,分析师开发了多种方法来检查线性模型的有效性。不过,在以预测为目的的情况下,只要结果变量是特征的增函数或减函数,线性模型通常能取得较好的预测效果。
1.2 R - 平方值
R² 是实际值与预测值之间的平方相关性,可以解释为 Y 的变化中由 X 引起的比例,取值范围在 0 到 1 之间。但由于我们是用同一组数据来估计回归系数和进行预测,可能会出现过拟合的情况,导致 R² 值过于乐观。因此,qeLin() 函数不仅会报告标准 R²,还会报告在保留数据集上计算的 R²,后者更为可靠。此外,线性回归软件库通常还会报告调整后的 R² 值,若该值与标准 R² 值差异较大,则可能表示存在过拟合。
2. 分类应用:逻辑模型
线性模型主要用于回归应用,对于分类问题,广义线性模型可以发
超级会员免费看
订阅专栏 解锁全文
9908

被折叠的 条评论
为什么被折叠?



