神经网络基础知识笔记（2）

对方正在长头发~

已于 2023-05-12 16:36:24 修改

阅读量363

点赞数

分类专栏：深度学习神经网络自学笔记文章标签：笔记

于 2023-05-03 00:03:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_51597565/article/details/130437563

版权

深度学习神经网络自学笔记专栏收录该内容

2 篇文章

订阅专栏

文章介绍了神经网络中的反向传播算法，包括梯度下降的方向、距离（学习率）和终止条件。此外，提到了正则化的重要性和不同激活函数的作用，如Sigmoid和ReLU。参数初始化通常采用随机策略，并且Dropout被用来防止过拟合。整个讨论围绕如何优化神经网络模型进行。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

4.反向传播（梯度下降）

先介绍一下梯度下降法：

(1)方向问题

(2)距离问题

(3)终止条件

正式介绍反向传播

6.正则化与激活函数

6.参数初始化(非常重要)

梳理整体（总结）

接上篇笔记，我继续学习有关神经网络的知识。

4.反向传播（梯度下降）

先介绍一下梯度下降法：

用一句话解释就是快速找到最低点的一个方法。

比如下图中沿着箭头所示走就能到红旗处（最低点）。

要实现这个过程中有三个问题 1.方向 -▽f 2.距离 η 3.终止条件 ||▽f||

(1)方向问题

这是个一元函数，自变量只有两个方向，一个朝左，一个朝右。

朝右边运动，越走越高，函数值增加，这个方向称为梯度方向。朝左边运动，越走越低，函数值在减小，这个方向称为梯度的反方向。

显然，要走到最低点，我们要选择梯度的反方向，重复之前的逻辑，不断朝梯度的反方向运动。“运气好“”的话，我们可以到达最低点。

这里的“运气好”是指走的距离合适。距离不合适有可能会越走越远，永远到不了谷底。

(2)距离问题

要完成梯度下降，需要选择合适的学习率。学习率是0.2时，迭代10次基本就能降到谷底。

学习率过大或者过小，有可能会反复横跳或者迭代很多次也到达不了最低点，浪费计算量。

(3)终止条件

η为0.2时，每次迭代后，梯度值在不断下降，第十次为0.12来到谷底附近，梯度为0时是最低点位置。只要学习率选择的合适，梯度就可以下降到任意小。

正式介绍反向传播

举个简单栗子：f(x,y,z)=(x+y)z 假设x=-2,y=5,z=-4,现在想让函数值变小，那就变小x、y、z的值。

令q=x+y ，q对x求偏导=1，q对y求偏导=1

f=qz, f对q求偏导得z,f对z求偏导得q

我们想得到，由链式求导法则可知：f对x求偏导=f对q求偏导*q对x求偏导，f对y求偏导同上。

注意：反向传播是从后往前逐层计算。（链式法则）

复杂的栗子：逐层求解：

1/x求偏导得-(1/x^2)，所以-（1/1.37^2）=-0.53，所以1/x这层梯度是-0.53，向前传递，+1表示x+1,x+1求偏导是1，计算这层的梯度为-0.53*1=-0.53，一直逐层向前求。在这里我们只需理解它，实际应用中不会让你去算，直接调包使用就行。

也可以直接一块一块的计算：

5.整体架构

层次结构：一层一层对数据进行变换。

神经元：数据的量或者说是矩阵的一个大小。

全连接：

非线性：加在了每一步矩阵计算之后，进行一个非线性变换。

神经网络的一个强大之处在于用更多的参数来拟合复杂的数据！

6.正则化与激活函数

（1）正则化的作用

参数对结果的影响：参数个数比如64 128 256 512等

（2）激活函数：

常见的激活函数：Sigmoid,Relu,Tanh函数等

激活函数对比

Sigmoid函数可能会发生梯度消失的情况（一般不用），现在一般都用Relu函数（不会出现梯度消失现象），或者它的变体。

6.参数初始化(非常重要)

通常我们都使用随机策略来进行参数初始化

W = 0.01*np.random.randn(D,H)

7.DROP-OUT

过拟合是神经网络中很头疼的一个问题（那我们就不要让这个网络太强）

即舍弃其中一部分来增强抗拒拟合的能力。

上面左图是完整的神经网络，每一个神经元相互连接。

上面右图即使用了drop-out，在训练的过程中在每一层随机的选择固定比例的神经元杀死，其中圆中带×的就是这次没选择，但不是指一直不选择它，有可能下次就会选中，是随机的。drop-out可以说是一个比例，比如在训练过程中每次有50%的神经元不参与这次的训练。

梳理整体（总结）

说白了，就是找合适的权重参数（即一系列W），解决过拟合的方法有正则化或者加drop-out等方法。

对方正在长头发~

博客等级

码龄5年

8
原创

32
点赞

90
收藏

35
粉丝

关注

私信

热门文章

分类专栏

深度学习 4篇
深度学习神经网络自学笔记 2篇

展开全部收起

上一篇：: 神经网络基础知识笔记(1)

下一篇：: 解决ERROR: Could not build wheels for mpi4py, which is required to install pyproject.toml-based proj

最新评论

LeNet图像分类-基于UCM数据集的遥感图像分类
m0_70240607: 有解决方法吗
VGGNet遥感图像分类学习笔记
优快云-Ada助手: 恭喜您写出了这篇有价值的博客，分享了关于VGGNet在遥感图像分类方面的学习笔记。希望您能继续坚持创作，为大家带来更多有用的知识和经验。下一步建议可以考虑分享一些实际应用的案例，让读者更好地理解和应用所学知识。期待您的下一篇博客。优快云会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
LeNet图像分类-基于UCM数据集的遥感图像分类
花火Eclipse: 你这用的数据集是CIFAR10啊，后面分类又用UCM的类别。。。
AlexNet实现图像分类-基于UCM数据集的遥感数据图像分类
优快云-Ada助手: 非常感谢你的分享，恭喜你成功实现了基于UCM数据集的遥感数据图像分类。你的博客对我们这些初学者来说非常有启发性，让我们对AlexNet更加深入地了解。下一步，建议你可以尝试使用其他数据集进行实验，进一步完善你的技术水平。期待你的下一篇精彩博客！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
GoogLeNet图像分类-基于UCM数据集的遥感图像分类
优快云-Ada助手: 很高兴看到你写了第二篇博客，继续分享你的知识和经验。你的博文题目和摘要中提到了使用GoogLeNet算法基于UCM数据集进行遥感图像分类的方法，这是非常有价值的。除此之外，我想强调一些扩展知识和技能，以便你继续拓展你的领域。首先，深入了解卷积神经网络（CNN）的其他算法，如VGG、ResNet、Inception等，可以帮助你更好地理解和应用GoogLeNet。其次，学习如何处理更大规模的数据集，以提高模型的准确性和鲁棒性。最后，研究如何将图像分类算法应用于实际场景中，例如识别交通标志、人脸识别等，可以帮助你更好地应用你的技能和知识。感谢你的分享，期待你更多的博客。如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。