批量归一化 && 残差网络

最新推荐文章于 2024-06-13 18:57:00 发布

原创

最新推荐文章于 2024-06-13 18:57:00 发布 · 650 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#批量归一化 #残差网络 #卷积神经网络 #pytorch

本文深入探讨了深度学习中的关键概念和技术，包括批量归一化（Batch Normalization）、残差网络（ResNet）以及稠密连接网络（DenseNet）。详细讲解了批量归一化如何改善深度模型的训练，残差网络如何解决深度学习中的退化问题，以及DenseNet如何通过特征复用提升模型效率。

基于此前对于CNN的介绍

就深层次 CNN 的结构进一步探讨归一化和残差网络。

批量归一化（BatchNormalization）

让网络训练归一化变得更加容易，本质是一种对数据的标准化处理

分类

对输入的标准化（浅层模型）

处理后的任意一个特征在数据集中所有样本上的均值为0、标准差为1。标准化处理输入数据使各个特征的分布相近

批量归一化（深度模型）随着模型参数的迭代更新，靠近输出层的数据剧烈变化

利用小批量上的均值和标准差，不断调整神经网络中间输出，从而使整个神经网络在各层的中间输出的数值更稳定。

应用

对全连接层做批量归一化

位置：全连接层中的仿射变换和激活函数之间。

全连接：
$\boldsymbol{x} = \boldsymbol{W\boldsymbol{u} + \boldsymbol{b}} \\ output =\phi(\boldsymbol{x})$

输入是u，经过仿射变化得到x，经过激活函数得到output，size=(batch_size，输出神经元的个数)

批量归一化：
$output=\phi(\text{BN}(\boldsymbol{x}))$

$\boldsymbol{y}^{(i)} = \text{BN}(\boldsymbol{x}^{(i)})$

$\boldsymbol{\mu}_\mathcal{B} \leftarrow \frac{1}{m}\sum_{i = 1}^{m} \boldsymbol{x}^{(i)},$

$\boldsymbol{\sigma}_\mathcal{B}^2 \leftarrow \frac{1}{m} \sum_{i=1}^{m}(\boldsymbol{x}^{(i)} - \boldsymbol{\mu}_\mathcal{B})^2,$

$\hat{\boldsymbol{x}}^{(i)} \leftarrow \frac{\boldsymbol{x}^{(i)} - \boldsymbol{\mu}_\mathcal{B}}{\sqrt{\boldsymbol{\sigma}_\mathcal{B}^2 + \epsilon}},$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。