本文是记录在学习吴恩达老师深度学习的课程中,自己对其中一些知识的理解和相关推导,如有错误希望各位前辈指教。
1.9 Normalizing training sets
在视频中出现了归一化的方法:(注意:该归一化方法是将原始数据转化为均值为0,方差为1的分布)
第一步:零均值化 (中间坐标显示)
第二部:单位方差 (最右坐标显示)

对于其中为什么 极其疑惑,搜索了很多网站,发现公式应为
。
为什么能够将方差变为1?

1.11 神经网络的权重初始化
这里提出的初始化方法叫做Xavier 初始化方法:为什么V=1/n[L-1]?
参考链接:https://zhuanlan.zhihu.com/p/27919794,图中的回答是链接中一部分。

而为什么
![]()
也是为了把W的方差变为1/n[L-1]。

本文记录了学习吴恩达深度学习课程的心得,重点解析了训练集归一化的步骤与原理,以及Xavier权重初始化方法背后的数学逻辑,探讨如何使方差稳定在1/n[L-1]。
1042

被折叠的 条评论
为什么被折叠?



