基于深度强化学习的延迟与隐私联合优化
在当今的无线通信和计算领域,如何在保证计算效率的同时保护用户隐私是一个重要的研究课题。本文将介绍一种基于深度强化学习的方法,用于联合优化延迟和隐私,通过对系统模型的构建、问题的提出以及算法的设计,实现计算速率和隐私保护水平的平衡。
1. 符号说明
首先,我们来看一些重要的符号及其含义,如下表所示:
| 符号 | 描述 |
| ---- | ---- |
| .M | 无线设备集合 |
| .T | 时间槽集合 |
| .hm | 设备 m 处的信道功率增益 |
| .αL m | 设备 m 本地执行任务 |
| .αO m | 设备 m 卸载任务以保护使用模式隐私 |
| .αP m | 设备 m 卸载任务以保护两种隐私 |
| .Em | 第 m 个无线设备获得的能量 |
| .r∗ L,m | 一个时间槽内的最大本地计算速率 |
| .Dm | 设备 m 的卸载任务大小 |
| .bm | 设备 m 卸载任务所需的时间 |
| .P o m | 设备 m 的发射功率 |
| .r∗ O,m | MEC 服务器的最大计算速率 |
| .Pl,m | 保护位置隐私的奖励 |
| .Pμ,m | 保护使用模式隐私的奖励 |
| .Pm | 设备 m 的隐私保护水平 |
我们假设 .hm 在下行链路和上行链路中相同,并且在一个时间槽内是静态的。无线设备可以在充电的同时本地执行任务。