16、线性回归模型的构建与评估

线性回归模型的构建与评估

1. 线性回归基础

当某些假设被违反时,我们仍可使用传统回归模型,但可能需要对数据进行某种变换。下面将详细介绍线性回归的常见估计技术以及相关概念。

1.1 普通最小二乘法(OLS)

线性回归最常用的估计技术是普通最小二乘法(OLS)。OLS 选择的系数能使实际目标值与预测值之间的平方距离之和最小,具体公式为:$\sum_{i = 1}^{N}(y_{i}-\hat{y} {i})^{2}$,其中$y {i}$是第$i$个观测的实际值,$\hat{y} {i}$是预测值,$y {i}-\hat{y}_{i}$被称为残差。

从图形上看,OLS 会拟合一条直线,使数据点到该直线的垂直距离最小。对于简单线性回归(只有一个特征),每个数据点到回归直线的垂直距离就是残差,残差可正可负。

对于直线$y = \beta_{0} + \beta_{1}x$,它给出了每个$x$值对应的$y$的预测值,等于估计的截距$\beta_{0}$加上特征的估计系数乘以特征值$\beta_{1}x$,这就是 OLS 直线。任何其他穿过数据的直线都会导致更高的残差平方和。该方法可扩展到多元线性回归模型,公式为$y = \beta_{0} + \beta_{1}x_{1} + \beta_{2}x_{2} + \cdots + \beta_{n}x_{n} + \epsilon$,其中$y$是目标,每个$x$是特征,每个$\beta$是系数(或截距),$n$是特征数量,$\epsilon$是误差项。每个系数表示相关特征每变化 1 个单位时目标的估计变化。需要注意的是,系数在每个特征的整个范围内是恒定的,

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值