Deep Reinforcement Learning Based Resource Allocation for V2V Communications(点击可见原文)
p.s.此文19年发表,到20年8月被引199次
论文要解决的问题
单播和广播场景下,考虑V2V通信的资源分配,使用分布式方案,在无 global information 的前提下为 V2V链路 or 车辆 找到最优的子带和功率等级,该算法能满足V2V链路的延迟约束并最小化对 V2I 的干扰。
使用深度强化学习解决,已开源并有哥们写了double DQN的版本。
通信场景 // for unicast communication
存在 M 个 V2I 链路,K 对 V2V 链路。为提高频谱效率,假设V2V共享V2I的上行链路频谱,这是因为基站处的干扰更易控制且上行链路使用较少。
m号V2I 的 SINR 为:
其中 和
分别表示 m号CUE和 k号VUE 的发射功率,h是与 m号CUE相关的信道的增益,
是 k号VUE的干扰增益,
为频谱分配的 indicator
m号V2I 的容量为:
k号VUE的S