机器学习(李宏毅)lecture01 学习笔记(Regression)

Regression

第一步:找模型

(1)线性模型:y=b+∑wixiy=b+{\sum}w_ix_iy=b+wixi
xxx:特征。
xix_ixi:特征xxx的一个属性值。
wiw_iwi:(weight)对应xix_ixi的一个权值。
bbb:(bias)

第二步:损失函数

input: function.
output:how bad the function is.

L:L:L:均方误差。
L(w,b)=∑i=1n(yi−(b+w⋅xi))2L(w,b)=\sum^n_{i=1}(y_i-(b+w·x_i))^2L(w,b)=i=1n(yi(b+wxi))2
f∗=argminfL(f)f^*=argmin_fL(f)f=argminfL(f)
w∗,b∗=argminw,bL(w,b)w^*,b^*=argmin_{w,b}L(w,b)w,b=argminw,bL(w,b)
=argminw,b∑i=1n(yi−(b+w⋅xi))2=argmin_{w,b}\sum^n_{i=1}(y_i-(b+w·x_i))^2=argminw,bi=1n(yi(b+wxi))2
在这里插入图片描述

第三步:梯度下降

损失函数只有一个参数www
在这里插入图片描述
w0w^0w0:随机设
w1=w0−ηdLdw∣w=w0w^1=w^0-{\eta}\frac{dL}{dw}|w=w^0w1=w0ηdwdLw=w0
w2=w0−ηdLdw∣w=w1w^2=w^0-{\eta}\frac{dL}{dw}|w=w^1w2=w0ηdwdLw=w1
.........
η\etaη:学习率或步长。

多个参数时,同理分别更新。

Gradient∇L=[∂L∂w,∂L∂b,...]T{\nabla}L=[\frac{{\partial}L}{{\partial}w},\frac{{\partial}L}{{\partial}b},...]^TL=[wL,bL,...]T

过拟合(overfitting):在训练时效果很好,但在测试时效果不好。

Regularization:
L(w,b)=∑i=1n(yi−(b+w⋅xi))2+λ∑(wi)2L(w,b)=\sum^n_{i=1}(y_i-(b+w·x_i))^2+\lambda\sum(w_i)^2L(w,b)=i=1n(yi(b+wxi))2+λ(wi)2
wiw_iwi越小时,函数比较平滑,比较好,但不能过于平滑。(原因:噪声的影响比较小)b和平滑程度无关。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值