多元回归(Multiple Regression)是一种统计学方法,用于建立一个因变量(响应变量)与多个自变量(解释变量)之间的关系。多元回归的目的是通过最小化预测误差来找到最佳的拟合模型,从而可以用来预测因变量的值或理解自变量与因变量之间的关系。
多元回归就像线性回归一样,但是具有多个独立值,这意味着我们试图基于两个或多个变量来预测一个值。
多元回归的基本形式可以表示为:
其中:
- yy 是因变量。
- x1,x2,…,xnx1,x2,…,xn 是自变量。
- β0β0 是截距项(intercept)。
- β1,β2,…,βnβ1,β2,…,βn 是回归系数(regression coefficients)。
- ϵϵ 是误差项(error term),表示模型无法解释的随机误差。
例子:一组数据集,其中包含了一些有关汽车的信息。
Car | Model | Volume | Weight | CO2 |
---|---|---|---|---|
Toyota | Aygo | 1000 | 790 | 99 |
Mitsubishi | Space Star | 1200 |