权重偏差初始化

最新推荐文章于 2024-09-21 22:09:18 发布

啵啵玩转AI-BigData

最新推荐文章于 2024-09-21 22:09:18 发布

阅读量174

点赞数

分类专栏：深度学习基础文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/weixin_41767872/article/details/133981181

版权

深度学习基础专栏收录该内容

10 篇文章

订阅专栏

文章目录

1. 全都初始化为0
2. 全部初始化为同样的值
3. 初始化为小的随机数

1. 全都初始化为0

偏差初始化陷阱：都初始化为 0。
产⽣陷阱原因：因为并不知道在训练神经⽹络中每⼀个权重最后的值，但是如果进⾏了恰当的数据归
⼀化后，我们可以有理由认为有⼀半的权重是正的，另⼀半是负的。令所有权重都初始化为 0，如果
神经⽹络计算出来的输出值是⼀样的，神经⽹络在进⾏反向传播算法计算出来的梯度值也⼀样，并且
参数更新值也⼀样。更⼀般地说，如果权重初始化为同⼀个值，⽹络就是对称的。
形象化理解：在神经⽹络中考虑梯度下降的时候，设想你在爬⼭，但⾝处直线形的⼭⾕中，两边是对
称的⼭峰。由于对称性，你所在之处的梯度只能沿着⼭⾕的⽅向，不会指向⼭峰；你⾛了⼀步之后，
情况依然不变。结果就是你只能收敛到⼭⾕中的⼀个极⼤值，⽽⾛不到⼭峰上去。

2. 全部初始化为同样的值

如果神经网络中的权重全部初始化为相同的值，通常会出现以下问题：

对称性问题：如果所有的权重都相同，那么在前向传播中，每个隐藏单元都会接收相同的输入信号，这会导致所有隐藏单元学习相同的特征。这会导致网络的层级结构丧失，因为所有单元都在执行相同的操作，降低了网络的表达能力。
梯度消失或梯度爆炸：在反向传播过程中，由于权重相同，所有权重的梯度也将相同。这可能导致梯度消失或梯度爆炸问题，这在深层网络中尤为严重，因为在反向传播中，梯度会以指数级别增加或减少，从而使权重调整变得异常困难。

为了解决这些问题，通常采用随机初始化权重的方法，以打破对称性并使每个神经元学习不同的特征。常见的权重初始化方法包括均匀分布、正态分布和截断正态分布。这些方法有助于确保神经网络可以有效地学习和收敛。

3. 初始化为小的随机数

是的，通常将神经网络的权重初始化为小的随机数是一种有效的策略，以避免对称性问题和梯度问题。这被称为随机初始化。具体来说，一些常见的随机初始化方法包括：

均匀分布随机初始化：在指定的范围内，随机生成权重，例如在 [-0.1, 0.1] 或 [-0.01, 0.01] 之间。这有助于打破对称性。
正态分布随机初始化：使用均值为0和较小标准差的正态分布（通常在0附近），以初始化权重。这也有助于打破对称性，并且适用于许多神经网络架构。
截断正态分布随机初始化：与普通的正态分布不同，这里可以指定一个截断标准差，以确保权重的值在某个范围内。

这些随机初始化方法有助于确保每个神经元在训练过程中学习不同的特征，从而提高神经网络的性能和训练速度。选择适当的初始化方法取决于网络的体系结构和问题的特性。

啵啵玩转AI-BigData

博客等级

码龄7年

54
原创

363
点赞

607
收藏

258
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 预训练与微调

下一篇：: 学习率理解

最新评论

大厂面试sql手撕题目总结
Mr_Turban: 博主好强，感谢博主，看了你的题解总结，已经上岸B站了
H2-FDetector模型解析
普通网友: 你的博客内容深入浅出，总是让我不再感到学习的困难，每一篇博文都是我学习的宝库。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
大厂面试sql手撕题目总结
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
机器学习中分类算法的评估方法
优快云-Ada助手: 恭喜您写下了第四篇博客！标题“机器学习中分类算法的评估方法”非常吸引人。您的博客为读者提供了关于机器学习分类算法评估的重要信息，这对于那些对这个领域感兴趣的人来说肯定非常有帮助。在下一步的创作中，我谦卑地建议您可以考虑更深入地探讨不同分类算法的评估方法，并结合实际案例进行说明。您可以尝试列举一些常见的分类算法，如决策树、支持向量机等等，并逐一介绍它们的评估指标和使用场景。这样的内容会更加丰富和实用，让读者对分类算法的评估有更全面的了解。继续保持创作的热情，期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.youkuaiyun.com/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
torch.optim.Adam(）
优快云-Ada助手: 恭喜你写了第5篇博客！看到你对torch.optim.Adam()的深入探讨，我感到非常欣慰。你的文章内容丰富，分析透彻，让我受益匪浅。希望你能继续保持创作的热情，不断探索更多有价值的主题，比如可以尝试探讨一下不同优化器在不同场景下的表现对比，这样会更加丰富你的博客内容。期待你更多的精彩作品！加油！

大家在看

408第一季 - 数据结构 - 散列表 274

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。