- 博客(30)
- 收藏
- 关注
原创 [论文阅读]JTORO in NOMA-based VEC:A game-theoretic DRL approach
论文:Joint task offloading and resource optimization in NOMA-based vehicular edge computing: A game-theoretic DRL approach。
2024-09-01 21:41:02
1698
2
原创 [论文阅读]Mobility-Aware Cooperative Caching in VEC Based on CAFR
论文:Mobility-Aware Cooperative Caching in Vehicular Edge Computing Based on Asynchronous Federated and DRLJSTSP 2022。
2024-08-09 19:40:53
1434
3
原创 User Allocation In MEC: A DRL Approach 论文笔记
论文:ICWS 2021随着对低延迟需求的增加,边缘计算或雾计算逐渐成为主流。当前最先进的技术假设边缘服务器上的等于从边缘服务器提供的的。然而,的与之间通常存在高度的关系,尤其CPU-GPU协同执行,使资源利用率的数学建模异常复杂。目前用于解决问题的算法普遍假设与呈假设是的。然而,实际服务过程中资源使用量是的,难以通过数学建模精确描述。提出一种框架来解决问题,基于与MEC系统的经验和交互逐步学习。DRL Agent在服务延迟阈值约束下学习在某上服务的。DRL Agent。
2024-07-21 11:47:50
1228
1
原创 [RL]DQN、DDQN、DuelingDQN原理、代码实现
因为有时候我们更新的时候,不一定是更新 Q 表格,而是只更新了 V (s),但更新 V (s) 的时候,只要修改 V (s) 的值,Q 表格的值也会被修改。蓝色的锯齿状的线是 DDQN 的 Q 网络所估测出来的 Q 值,蓝色的无锯齿状的线是真正的Q 值,它们是比较接近的。假设估计噪声为高斯,无偏均值为0,误差可正可负,到此并无大碍,但是接下来的更新时的操作计算TD-target的时候,使用了max操作,这导致在这一步的误差始终为正的,造成正的偏差,这就是导致高估的原因。但是在估计的时候,网络是有误差的。
2024-03-11 16:05:50
2881
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人