林轩田《机器学习基石》(九)—— Linear regression

上一次讲到VC bound适合各种err。以及有noise的情况下,VC Bound理论仍然是成立的。本节课介绍机器学习最常见的一种算法:Linear Regression.

一、回归问题

我们依旧从信用卡的问题来讲,现在的信用卡问题不再是给某人信用卡,而是该给这个多少额度。

学习流程图如下所示:

此刻的学习目标变为了输出实数的函数,即y=\mathbb{R},上面的问题是线性回归(Linear Regression)问题。

我们利用资料来算一个加权的分数,决定给这个人多少额度:

顾客特征: \mathbf{x}=\left(x_{0}, x_{1}, x_{2}, \cdots, x_{d}\right)

加权后的分数:y \approx \sum_{i=0}^{d} w_{i} x_{i}

可视化来讲,在二维平面中,我们希望找到的这条蓝色直线,和资料‘o’越接近越好(红色竖线越短,直线与资料越接近)。

三维空间同理。回归分析要做的事情就是找到最好的直线/超平面来描述资料。红色竖线被叫做残差residuals。

如何衡量这些残差呢,我们使用平方误差来衡量。

在已知样本上:

在未知样本上:

之前我们知道err不影响VCbound,所以现在主要考虑如何让E_{in}极小化。

二、线性回归算法

我们把E_{in}写成矩阵的形式。

然后我们作出

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值