Deep Leaning 学习笔记之改善神经网络的超参数(3.2)—— 批量初始化Batch norm及Softmaxr

本文探讨了深度学习中改善神经网络超参数的方法,重点在于批量初始化(Batch Norm)和Softmax的运用。批量初始化通过γ和μ超参数控制均值和方差,而Softmax作为激活函数用于计算行动概率,其反向传播的梯度计算公式也被详细阐述。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1 批量初始化

1.1 定义

除了对X能够进行均值归一,对各个隐藏层也可以初始化,即对Z统一初始化

1.2 方法

下图中的γγγμμμ,是两个超参数,可以控制均值和方差的界限
(一般来说都是均值为0,方差为1,但是不一定,因此可以通过这两个超参数进行控制)
还有种情况就是,当γ=σ2+ε,β=μγ=\sqrt{σ^2+\varepsilon},β=μγ=σ2+ε

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值