蒙特卡罗方法:原理、应用与挑战
1. 随机算法分类
随机算法大致可分为两类:拉斯维加斯算法和蒙特卡罗算法。
- 拉斯维加斯算法 :总是能返回精确的正确答案(或者报告失败),不过这类算法消耗的资源(通常是内存或时间)是随机的。
- 蒙特卡罗算法 :返回的答案带有随机误差,通常可以通过投入更多资源(如运行时间和内存)来减少误差。对于任何固定的计算预算,蒙特卡罗算法都能提供一个近似答案。
在机器学习中,许多问题非常困难,难以获得精确答案,因此精确的确定性算法和拉斯维加斯算法不太适用,我们通常会使用确定性近似算法或蒙特卡罗近似方法,本文将重点介绍蒙特卡罗方法。
2. 采样与蒙特卡罗方法
2.1 为何需要采样
从概率分布中采样有诸多原因:
- 近似求和与积分 :采样提供了一种灵活的方式,能以较低成本近似许多求和与积分。例如,在训练模型时,使用小批量对完整训练成本进行子采样,可显著加速计算。
- 处理难计算的求和或积分 :某些学习算法需要近似难以处理的求和或积分,如无向模型的对数配分函数的梯度。
- 训练采样模型 :我们的目标可能是训练一个能从训练分布中采样的模型。
2.2 蒙特卡罗采样基础
当求和或积分无法精确计算时(例如求和项数呈指数级且无精确简化方法),可以使用蒙特卡罗采样进行近似。其核心思想是将求和或积分视为某个分布下的期望,然后用相应的平均值来近似该期望。
超级会员免费看
订阅专栏 解锁全文
4344

被折叠的 条评论
为什么被折叠?



