本章从**随机梯度下降(SGD)作为随机动力学(Langevin)**的视角出发,严格推导相关 SDE 极限、Fokker–Planck 描述、不随 Metropolis 的离散化偏差、温度退火(simulated annealing)收敛条件、以及 Markov 链蒙特卡洛(MH/HMC)基础与在深度学习中的变体(SGLD、pSGLD、U/Langevin 等)。
8.1 从 SGD 到 Langevin:扩散近似与极限 SDE
8.1.1 问题设定与记号

8.1.2 离散 SGD 与受噪 Langevin 迭代

8.1.3 精确到常数的离散→连续推导(中心极限定理风格)

订阅专栏 解锁全文
848

被折叠的 条评论
为什么被折叠?



