梯度下降(感知机为例)

先看了宋浩老师高数的课搞懂方向导数和梯度的概念

一、方向导数和梯度

1.方向导数(是个数)

人话来说就是从一个点出发,沿这个方向的导数。先看方向导数的定义:

\lim_{t->0}\frac{f(x_{0}+tcos\alpha ,y_{0}+tcos\beta )-f(x_{0},y_{0})}{t}

不过是从二维的求导变成了三维的求导,从(x_{0},y_{0})出发,到(x,y),t是两点距离。

 2.梯度(是个向量)

就是从这一点出发,方向导数最大的方向(最陡的地方)

大小:梯度的模是方向导数

方向:从这点出发,指向最陡的地方

二、感知机的梯度下降(此处为随机梯度下降)

随机梯度下降:一次随机选一个误分类点使其梯度下降。

感知机的算法是为了找到使损失函数中,参数w,b最小的模型。

 

先随机定个(w_{0},b_{0}),一步一步让w,b接近最优值。

损失函数L(w,b)的梯度为:(L对w求偏导,L对b求偏导),再随机选个样本(x_{i},y_{i})代入,得出(-\sum y_{i}x_{i},-\sum y_{i}),即从(w_{0},b_{0})出发,向着(-\sum y_{i}x_{i},-\sum y_{i})的方向最陡峭。

因为是随机梯度下降,所以不求和。

 此时就可以对w,b点进行更新

 这里为什么是加法呢,因为(-\sum y_{i}x_{i},-\sum y_{i})是两个正数,所以把负号去了就是减去。

为什么减去偏导呢,这两个偏导是个方向,往这里走就能使L减小。

\eta是步长,几倍就是向下走几步。

大概能这样理解一下:(灰色线条为L(w,b))

 以上为个人理解,有不对的地方请告诉我

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值