CS231n 卷积神经网络与计算机视觉 3 最优化与随机梯度下降

上节中我们已经接触到了图像识别中的两部分score function和 loss function,这节将会引入对loss function的优化求解,也就是optimization。为了求解loss function我们首先将loss function 可视化

Visualizing the loss function

一般来说在图像处理的时候我们结果的数据都是多维的,前面CIFAR-10 的图片有3072维,一共10类,那么我们需要的参数就有30730个数据(表忘了还有b噢),显然无法将这么多维数据直接可视化,我们的方法是:先随机选一个初始的参数向量(30730个参数),然后给定一个变化的方向,每次沿这个方向变化一点就可以得到沿这个方向变化的所有参数的表现情况(一维可视化 L(W+aW1) ),如果我们给定了两个变化的方向,就可以在二维平面将其可视化( L(W+aW1+bW2) ),如下图:
这里写图片描述
这里左侧是以个方向的变化情况,纵坐标是loss值,右侧是两个方向变化得到的loss值(蓝色代表小的loss),左侧和中间是在一个数据上得到的loss,最右侧是在100个样本中得到的loss之后取的平均值。
我们可以这样解释loss function的分段线性:
假设我们有三个样本,使用svm分类,分类器只有一个参数w,那么我们可以得到三个样本的loss 函数:

L0=L1=L2=L=max(0,wT1x0wT0x0+1)+max(0,wT2x0w
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值