基于BERT的深度强化学习求解图上的组合优化问题(未完)


Abstract

组合优化,如图上的车辆路径和旅行商问题,是NP-hard问题,几十年来一直被研究。已经提出了许多方法来解决这些问题,包括但不限于精确算法、近似算法、启发式算法和解决方案求解器。然而,这些方法无法学习问题的内部结构,也无法推广到类似或更大规模的问题。最近,深度强化学习已被应用于组合优化并取得了令人信服的结果。尽管如此,有效整合和训练改进的挑战依然存在。在本研究中,我们提出了一个新的框架(BDRL),结合BERT(来自Transformer的双向编码器表示)和深度强化学习,通过将一般优化问题视为在已识别数据分布下的数据点来解决图上的组合优化问题。我们首先改进了BERT的Transformer编码器,以有效嵌入组合优化图。通过采用对比目标,我们将BERT类训练扩展到强化学习中,并获取自注意力一致的表示。接下来,我们使用分层强化学习对模型进行预训练;即通过迭代过程训练和微调模型,使其更适合特定的组合优化问题。结果表明我们提出的框架在多个任务中的泛化能力、效率和有效性。

1 Introduction</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

太极生两鱼

要天天开心哦!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值