算法成角之路（深度学习进阶笔记）

TM 2.0

已于 2023-08-18 10:37:35 修改

阅读量45

点赞数

文章标签：算法深度学习笔记人工智能计算机视觉

于 2023-08-15 18:48:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qq_42693842/article/details/132269510

版权

深度学习进阶

深度学习的实现

训练, 验证, 测试集(Train/ Dev/ Test sets)

偏差方差

神经网络正则化

dropout正则化(Dropout Regularization)

随机删除神经单元

优化方法

mini-batch梯度下降法: p186

即每个batch反向传播一次
batch过大,单次迭代耗时长
batch过小,及为随机梯度下降法,失去向量化的加速增益,会在小范围收敛或波动

动量梯度下降法（Gradient descent with Momentum）

指数加权平均

$\ v_i = \beta v_{i-1} + (1-\beta)\theta_i$

偏差修正

不直接使用 $v_i$ 而是如下转换： $v_i \over 1-\beta^i$

动量梯度下降法 Momentum

利用指数加权平均计算 $d W$ 能够消除 $d W$ 的震荡
红点是最优点

均方根 RMSprop(root mean square prop): p210

平均各个方向的梯度, 加速梯度下降:
$S_{dw}=\beta S_{dW}+(1-\beta )(dW)^2$
$\over { \sqrt {S_{dW}}}}$

Adam优化算法(Adam optimization algorithm):p213

超参: $a,\beta_1,\beta_2,\epsilon$

学习率衰减(Learning rate decay)

局部最优的问题(The problem of local optima)

超参数调试 Batch正则化程序框架

调试处理(Tuning process):p223

归一化网络的激活函数:p235

batch归一化(Batch Norm) BN:p239

Softmax回归(Softmax regression):p251

$J(w^{[1]}$

结构化机器学习项目

正交化(Orthogonalization)

计算机视觉

卷积神经网络

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。