course 2 week1 初始化、正则化、梯度校验
course 2 week2 优化算法
()、[]、{}
()代表的是训练集的个数,[]代表的是神经网络层数的个数、{}代表的是不同mini-batch的个数
course 2 week3 batch norm&tensflow入门
1.使用batch norm预测时,针对z^~=Y*z^(i)+B中的Y和B两个超参数的选择问题
预测时,对z^~进行修正需要Y和B但因为这样需要你去遍历一次训练集才能获得较好的Y和B否则只有一个exmaple的Y和B会出现误差的问题(单个样本对集体有误差),所以在训练时需要记录好每一层的Y和B并且需要使用移动平均(别的平均也行)来获得B和Y
课程涵盖了初始化技术、正则化方法以及梯度校验在深度学习模型训练中的应用。第二周重点讨论了不同的优化算法。在第三周,我们学习了batchnorm的使用,特别是在预测时如何处理Y和B这两个超参数,以及在训练中如何利用移动平均来减小误差。此外,还介绍了tensorflow的入门知识。
186

被折叠的 条评论
为什么被折叠?



