神经网络学习（基于吴恩达视频学习）

海底捞肉

于 2024-08-30 01:00:00 发布

阅读量266

点赞数 3

文章标签：神经网络学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Z26855/article/details/141679199

版权

神经网路的权重初始化方法

pre-training

Pre-training阶段将神经网络每一层都取出，构造一个auto-encoder（自编译器）做训练使得输入层和输出层保持一致参数得以更新形成初始值

Fine-tuning阶段将pre-train过的每一层放回神经网络利用pre-train阶段得到的参数初始值和训练数据对模型进行整体调整

Random initalization

Xavier intialization

尽可能的让输入和输出服从相同的分布，这样就能够避免后面层的激活函数的输出值趋向于0

He intialization（针对于隐藏层使用ReLU的）

梯度下降法（求解机器学习算法的模型参数）

通过求目标函数的导数来寻求目标函数最小化的方法

找到目标函数最小化时的取值所对应的自变量的值目的是为了找自变量x

梯度的数值逼近
Mini batch

在梯度下降中，需要对所有的样本进行处理，如果样本规模较大时，效率会比较低。

这个时候，如果把所有的都迭代一轮的话，这时候的梯度下降叫做full bath。

但是为了提高效率，把样本分为等量的自己，每个子集叫做mini batch。

运行方式：分别用一个for循环遍历mini batch，针对每一个进行一次梯度下降，然后更新参数w 和b 的值。将遍历一次所有的样本的行为叫做epoch也就是一个世代。

指数加权平均

1.原理：通过赋予近期数据更大的权重，从而对数据序列的有效平滑，指数加权平均的优点在于，它能够根据数据的更新情况动态地调整个数据的权重，有效的处理数据序列的噪声和异常值。（具体可以在下文中查找）

深度学习与指数加权平均：原理、应用与发展 (baidu.com)

2.指数加权平均的偏差修正

2.5 指数加权平均的偏差修正-深度学习第二课《改善深层神经网络》-Stanford吴恩达教授-优快云博客

动量梯度下降法

之前梯度下降法的参数更新公式：

$W := W - \alpha \nabla W\\ b := b- \alpha \nabla b$

但是在动量梯度中：

对于100次的梯度下降中求得的梯度序列为：

{∇W1,∇W2,∇W3.........∇W99,∇W100}

对应动量梯度为：

动量梯度下降法(gradient descent with momentum)-优快云博客

博客等级

码龄3年

2
原创

4
点赞

4
收藏

10
粉丝

关注

私信

热门文章

最新评论

关于解决洛谷P2241 题的统计方形的解法
silver_muse: 博主好腻害！！！！！！
关于解决洛谷P2241 题的统计方形的解法
优快云-Ada助手: 非常棒的一篇博客！恭喜您开始了博客创作之旅。您的解法解决了这个问题，让我们更深入地理解了统计方形。期待您未来更多的分享！推荐【每天值得看】：https://bbs.youkuaiyun.com/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

关于解决洛谷P2241 题的统计方形的解法

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。