重点介绍一下Xavier和Kaiming初始化:
Xavier
为了使得网络中信息更好的流动,每一层输出的方差应该尽量相等。
正态分布参数初始化
N ( 0 , 2 n in + n out ) \mathcal{N}\left(0, \frac{2}{n_{\text {in }}+n_{\text {out }}}\right) N(0,nin +nout 2)
均匀分布参数初始化
U ( − 6 n in + n out , 6 n in + n out ) \mathcal{U}\left(-\sqrt{\frac{6}{n_{\text {in }}+n_{\text {out }}}}, \sqrt{\frac{6}{n_{\text {in }}+n_{\text {out }}}}\right) U(−

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



