机器学习--线性回归R语言_step函数r语言-优快云博客

本文链接：https://blog.youkuaiyun.com/dingchenxixi/article/details/50543822

本文介绍了如何使用R语言进行一元和多元线性回归分析。通过实例讲解了一元线性回归的残差分析、模型检验以及最小二乘法求解。在多元线性回归中，讨论了变量选择的重要性，提出了多重共线性问题，并提到了逐步回归方法如向前引入、向后剔除和逐步筛选。最后，介绍了R语言中的step、drop1和add1函数在逐步回归中的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

回归分析就是利用样本，产生拟合方程，从而进行预测。简而言之，就是你用你手头上的数据进行模型的训练，然后用你得到的模型对于新数据进行预测。

一元线性回归：

例子：

y<- c(61,57,58,40,90,35,68)#weight
x<-c(170,168,175,153,185,135,172) #height
plot(x,y)
z<- lm(y~x+1)#假设y=ax+b
lines(x,fitted(z))#添加拟合值对x的散点图并连线

coef(z)#求模型系数
formula(z)#提取模型公式

x代表身高，y代表体重

这是模型的概括
Call:
lm(formula = y ~ x + 1)

Residuals:
      1       2       3       4       5       6       7 
 -2.003  -4.002 -10.006  -5.992  11.988   7.019   2.996 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)   
(Intercept) -107.1018    34.8642  -3.072  0.02772 * 
x              1.0006     0.2099   4.768  0.00502 **
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 8.462 on 5 degrees of freedom
Multiple R-squared:  0.8197,    Adjusted R-squared:  0.7837 
F-statistic: 22.73 on 1 and 5 DF,  p-value: 0.005024

解读上述：

Residuals:
      1       2       3       4       5       6       7 
 -2.003  -4.002 -10.006  -5.992  11.988   7.019   2.996

这是表示残差
红点表示样本的值，y1'表示那条蓝色的拟合线的值
1 和 -2.003表示在第一个样本点的时候，残差为-2.003，也就是y1-y1’为-2.003

Coefficients:
             Estimate Std. Error t value Pr(>|t|)   
(Intercept) -107.1018    34.8642  -3.072  0.02772 * 
x              1.0006     0.2099   4.768  0.00502 **