二、线性回归

lizhaoxinLZX

于 2020-12-28 10:41:02 发布

阅读量159

点赞数 1

分类专栏：吴恩达-机器学习文章标签：算法机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/lizhaoxin666/article/details/111830825

版权

吴恩达-机器学习专栏收录该内容

13 篇文章

订阅专栏

吴恩达机器学习笔记——二、线性回归

说在最前面，这门课将要学什么
1 符号定义
2 代价函数的定义
3 代价函数的作用
4 梯度下降
- 4.1算法描述：
- 4.2 学习率的理解：

说在最前面，这门课将要学什么

在这里插入图片描述
我们开始吧！！！

1 符号定义

m：训练集的样本个数
x’s：输入变量/特征
y’s：输出变量/特征
(x, y)：一个训练样本
(x⁽ⁱ⁾, y⁽ⁱ⁾)：第i个训练样本
h：假设函数，h maps from x’s to y’s
= 表示判断
:= 表示赋值

2 代价函数的定义

我们要做regression，那么应该最小化平均误差值，即优化函数为：
在这里插入图片描述
所以我们定义代价函数J(θ₀, θ₁)为：
注意：J是θ的函数

3 代价函数的作用

假设我们需要拟合的数据为房屋面积与房价，做一次线性回归：
在这里插入图片描述
则针对不同的θ₀, θ₁，有不同的代价函数值，J(θ₀, θ₁)为三维空间中的一个曲面：

转化为等高线图：

故更好的假设函数的参数θ₀, θ₁对应更小的假设代价函数值，直观上看就是寻找J(θ₀, θ₁)在空间中的最低点。

4 梯度下降

4.1算法描述：

在这里插入图片描述
α：学习率
注意：θ₀, θ₁要同步更新左下为正确的更新步骤，右下为不正确的更新步骤：

4.2 学习率的理解：

令自变量向着令因变量（代价函数）减小的方向变化，而每次变化的幅度大小由学习率和当前位置的偏导数确定。

如果α太小：梯度下降会太慢
如果α太大：很可能越过最低点，甚至无法收敛或者发散

如果处于局部最低点，则梯度下降结束。但是线性回归的代价函数没有局部极小值，总是一个碗状的函数（凸函数）。
注意：我们每一步得到更新都用到了训练集中所有样本的偏导数，这又称为“Bach”梯度下降
以后的课程中会使用normal equations methods 来求代价函数J的最小值，不需要用迭代即可。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。