《Deep Learnning Tutorial》笔记（二）

深度学习基础：损失函数与梯度下降

最新推荐文章于 2023-04-15 14:42:36 发布

Bread Sir

最新推荐文章于 2023-04-15 14:42:36 发布

阅读量605

点赞数 1

CC 4.0 BY-SA版权

分类专栏： Deep Learning Tutorial

本文链接：https://blog.youkuaiyun.com/karry_zzj/article/details/77113407

Deep Learning Tutorial 专栏收录该内容

6 篇文章

订阅专栏

本文深入探讨了深度学习中的关键概念——损失函数及其重要性，并介绍了如何通过梯度下降法来优化神经网络参数，实现模型训练。

上一节简要学习了什么是神经网络，大体上知道了深度学习的一个框架。这一节继续学习深度学习第二步goodness of function。

Training Data

这个Data不仅仅需要判断的数据，还需要与之对应着的标签（target）。比如给一些图片，并且还给这些图片对应的是什么，有小狗狗还有小猫咪。

Learning Target

训练的目的就是要将输入数据经过某函数得到的输出数据（output）与对应着的标签（target）相比较，差别越小越好，这里的差别也叫损耗，即loss。也就是说找到这个函数使之差别最小。
A good function should make the loss of all examples as small as possible

每一个数据的损耗记为 $lr$ ，那么所有数据的总损耗就为 $L = \sum_{r=1}^Rlr$ ，所以目的就是find a function in function set —-> find the network parameters $θ^*$ 来让 $L$ 尽可能的小。

How to pick the best function

找函数其实就是找参数，还记得每个神经元都有自己的参数吗？？那整个神经网络的参数就是 $θ$ = { $w1, w2, ..., b1, b2, ...$ }，找到这些参数就能知道对应的函数是什么了。找参数，一个个暴力地试？？不现实！！接下来介绍一个方法来确定参数——Gradient Descent

Gradient Descent

梯度下降法：
就是一个不断递归求解最优的方法。计算过程就是沿梯度下降的方向求解极小值（也可以沿梯度上升方向求解极大值），而神经网络就是求解极小值。
我们用TensorFlow来训练一下。
这里写图片描述
我们发现此时的 $loss=0$ 为最小，而且 $k$ 也等于0，所以是训练最优，分类最好。我们也发现这个 $k$ 是不断下降的过程，这是最理想的。