吴恩达深度学习课程-第四周

最新推荐文章于 2024-08-11 03:27:18 发布

原创最新推荐文章于 2024-08-11 03:27:18 发布 · 538 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #神经网络 #超参数 #参数

深度学习专栏收录该内容

3 篇文章

订阅专栏

本文详细介绍了四层神经网络的结构，阐述了前向传播和反向传播的过程，其中前向传播通过计算权重和激活函数得到预测结果，反向传播用于更新权重。此外，还讨论了矩阵维度的核对，确保计算准确，并明确了参数与超参数的区别。超参数如学习率、迭代次数等对模型训练有重要影响。

1.深层神经网络

下图是一个四层的神经网络，其中符号表示如下：

$L$ 表示网络层数
$n^{[l]}$ 表示第 $l$ 层的神经元个数(输入层的索引为0)
$a^{[l]}=g^{[l]}(z^{[l]})$ 表示第 $l$ 层经过激活函数后的结果( $a^{[0]}$ 表述输入特征， $a^{[L]}$ 表示预测结果)
$w^{[l]}$ 表示在第 $l$ 层由于计算 $z^{[l]}$ 的权重( $b^{[l]}$ 同理)

在这里插入图片描述

1.1 前向传播和反向传播

以单个样本为例，当前输入为 $a^{[l-1]}$ ，前向传播的过程为：

$z^{[l]}=W^{[l]}·a^{[l-1]}+b^{[l]}$
$a^{[l]}=g^{[l]}(z^{[l]})$

反向传播的过程如下图所示，其中(5)是将(4)带入(1)中得到的：

在这里插入图片描述

整体流程如下图所示，由于在反向传播中会用到前向传播的中间计算结果 $z^{[l]}$ ，所以会将其进行缓存，其中蓝方框中的参数为当前层计算需要的计算值，绿方框为最后进行梯度下降需要的值：

在这里插入图片描述

1.2 核对矩阵的维数

对于神经网络中众多的矩阵，需要核对每个矩阵的维度才能保证计算的准确性，矩阵的具体大小如下：

$w^{[l]}:n^{[l]}×n^{[l-1]}$ ( $w^{[l]}$ 中每一行可以理解为每个神经元的向量表示)
$b^{[l]}:n^{[l]}×1$
$z^{[l]}:n^{[l]}×1$ ( $m$ 个样本时变为 $n^{[l]}×m$ )
$a^{[l]}:n^{[l]}×1($ $m$ 个样本时变为 $n^{[l]}×m$ )

1.3 参数VS超参数

整个网络中，参数即 $W$ 和 $b$ ，而超参数控制了最后的 $W$ 和 $b$ 的值，常见的超参数有：

学习率 $α\alpha$
梯度下降迭代次数 $i t e r a t i o n s$
隐藏层数目 $L$
隐藏层单元数 $n^{[l]}$
激活函数
正则化参数
$m i n i B a t c h S i z e$
…

2.参考

https://www.bilibili.com/video/BV1FT4y1E74V?p=36-42

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。