深度学习简介

最新推荐文章于 2025-05-05 00:24:47 发布

晊恦X.

最新推荐文章于 2025-05-05 00:24:47 发布

阅读量227

点赞数 4

分类专栏：深度学习文章标签：深度学习人工智能

本文链接：https://blog.youkuaiyun.com/qq_53983845/article/details/147334529

版权

深度学习专栏收录该内容

4 篇文章

订阅专栏

1 神经网络

2 定义函数的好坏

3 梯度下降

1 神经网络

你有好多排的神经元，每一排的神经元数目是不固定的，每层之间的神经元是两两相互连接的，把这样的网络称为神经网络。整个神经网络需要一组输入，例如对Layer 1的每个神经元来说，它的输入就是输入层的每一个维度；对于Layer L的神经元，它的后面没有接其他东西，它的输出就是整个神经网络的输出。

上图中的Input称为输入层，output称为输出层，其余层称为隐藏层。而所谓的deep就是指有很多隐藏层。

在2012年时，参加ImageNet比赛得到冠军的Alexnet有8层，错误率是16.4%；在2014的时候，VGG错误率是7.3%；22层的GoogleNet错误率降到了 6.7%；在2015年，引入了残差连接的Residual Net有152层，错误率为3.57%

神经网络的运作常常用矩阵运算来表示。假设第一层隐藏层的两个神经元的参数w分别是1，-2；-1,1，可以把他们排成一个矩阵 $\begin{bmatrix}1 & -2\\ -1 & 1 \end{bmatrix}$ ，当我们要用输入层的1，-1进行运算时，可以把输入层的数值写成一个向量 $\begin{bmatrix}1 \\ -1 \end{bmatrix}$ ，最后 $\begin{bmatrix}1 & -2\\ -1 & 1 \end{bmatrix}\begin{bmatrix}1 \\ -1 \end{bmatrix}+\begin{bmatrix}1 \\ 0 \end{bmatrix}=\begin{bmatrix}4 \\ -2 \end{bmatrix}$ ，如果是sigmoid激活函数，经过该函数后，值为 $\begin{bmatrix}0.98 \\ 0.12 \end{bmatrix}$

假设每一层的参数按照如下图定义，那么输出层的y要怎么计算？

通过 $\sigma (W^{1}x+b^{1})$ 计算出第一层隐藏层的输出值 $a^{1}$ ；通过 $\sigma (W^{2}a^{1}+b^{2})$ 计算出第二层隐藏层的输出值 $a^{2}$ ；通过这样的方法一层一层的计算下去，计算 $\sigma (W^{L}a^{L-1}+b^{L})$ 得到最终的输出y。也就是： $y=f(x)=\sigma (W^{L}...\sigma (W^{2}\sigma (W^{1}x+b^{1})+b^{2})...+b^{L})$