REINFORCEMENT LEARNING USING QUANTUM BOLTZMANN MACHINES利用量子波兹曼机进行强化学习

本文探讨了使用量子退火设备在强化学习任务中可能超越经典计算机的可能性。研究发现,模拟量子退火(SQA)在深Boltzmann机器(DBM)和量子Boltzmann机器(QBM)中进行采样可以有效增强学习。与受限Boltzmann机(RBM)相比,DBM在训练效率上有优势。QBM方法在强化学习中的表现优于RBM,显示了其在解决探索与剥削平衡问题中的潜力。研究还讨论了DBM布局在量子退火系统中的潜在应用,尤其是在未来量子设备中的实现可能性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

REINFORCEMENT LEARNING USING QUANTUM BOLTZMANN MACHINES

利用量子波兹曼机进行强化学习

Abstract. We investigate whether quantum annealers with select chip layouts can outperform classical computers in reinforcement learning tasks. We associate a transverse eld Ising spin Hamiltonian with a layout of qubits similar to that of a deep Boltzmann machine (DBM) and use simulated quantum annealing (SQA) to numerically simulate quantum sampling from this system. We design a reinforcement learning algorithm in which the set of visible nodes representing the states and actions of an optimal policy are the rst and last layers of the deep network. In absence of a transverse eld, our simulations show that DBMs a

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Adam婷

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值