机器学习（李宏毅）lecture01 学习笔记（Regression）

最新推荐文章于 2025-01-14 15:47:41 发布

原创最新推荐文章于 2025-01-14 15:47:41 发布 · 214 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习学习笔记

Regression

第一步:找模型

（1）线性模型： $y=b+∑wixiy=b+{\sum}w_ix_i$
$x$ ：特征。
$x_i$ ：特征 $x$ 的一个属性值。
$w_i$ ：（weight）对应 $x_i$ 的一个权值。
$b$ ：（bias）

第二步：损失函数

input： function.
output：how bad the function is.

$L :$ 均方误差。
$L(w,b)=∑i=1n(yi−(b+w⋅xi))2L(w,b)=\sum^n_{i=1}(y_i-(b+w·x_i))^2$
$f^*=argmin_fL(f)$
$w^*,b^*=argmin_{w,b}L(w,b)$
$=argminw,b∑i=1n(yi−(b+w⋅xi))2=argmin_{w,b}\sum^n_{i=1}(y_i-(b+w·x_i))^2$
在这里插入图片描述

第三步：梯度下降

损失函数只有一个参数 $w$ ：
在这里插入图片描述
$w^0$ ：随机设
$w1=w0−ηdLdw∣w=w0w^1=w^0-{\eta}\frac{dL}{dw}|w=w^0$
$w2=w0−ηdLdw∣w=w1w^2=w^0-{\eta}\frac{dL}{dw}|w=w^1$
$. . .$
$η\eta$ ：学习率或步长。

多个参数时，同理分别更新。

Gradient： $∇L=[∂L∂w,∂L∂b,...]T{\nabla}L=[\frac{{\partial}L}{{\partial}w},\frac{{\partial}L}{{\partial}b},...]^T$

过拟合（overfitting）：在训练时效果很好，但在测试时效果不好。

Regularization：
$L(w,b)=∑i=1n(yi−(b+w⋅xi))2+λ∑(wi)2L(w,b)=\sum^n_{i=1}(y_i-(b+w·x_i))^2+\lambda\sum(w_i)^2$
当 $w_i$ 越小时，函数比较平滑，比较好，但不能过于平滑。（原因：噪声的影响比较小）b和平滑程度无关。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。