【文献阅读03】Deep Reinforcement Learning Based Resource Allocation for V2V Communications

Deep Reinforcement Learning Based Resource Allocation for V2V Communications(点击可见原文)

p.s.此文19年发表,到20年8月被引199次

论文要解决的问题

单播和广播场景下,考虑V2V通信的资源分配,使用分布式方案,在无 global information 的前提下为 V2V链路 or 车辆 找到最优的子带和功率等级,该算法能满足V2V链路的延迟约束并最小化对 V2I 的干扰。

使用深度强化学习解决,已开源并有哥们写了double DQN的版本

通信场景 // for unicast communication

存在 M 个 V2I 链路,K 对 V2V 链路。为提高频谱效率,假设V2V共享V2I的上行链路频谱,这是因为基站处的干扰更易控制且上行链路使用较少。

m号V2I 的 SINR 为:

其中 P_m^c 和 P_k^v 分别表示 m号CUE和 k号VUE 的发射功率,h是与 m号CUE相关的信道的增益,\widetilde{h}_k 是 k号VUE的干扰增益,\rho_k为频谱分配的 indicator 

m号V2I 的容量为:

k号VUE的S

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值