22、基于深度强化学习的延迟与隐私联合优化

基于深度强化学习的延迟与隐私联合优化

在当今的无线通信和计算领域,如何在保证计算效率的同时保护用户隐私是一个重要的研究课题。本文将介绍一种基于深度强化学习的方法,用于联合优化延迟和隐私,通过对系统模型的构建、问题的提出以及算法的设计,实现计算速率和隐私保护水平的平衡。

1. 符号说明

首先,我们来看一些重要的符号及其含义,如下表所示:
| 符号 | 描述 |
| ---- | ---- |
| .M | 无线设备集合 |
| .T | 时间槽集合 |
| .hm | 设备 m 处的信道功率增益 |
| .αL m | 设备 m 本地执行任务 |
| .αO m | 设备 m 卸载任务以保护使用模式隐私 |
| .αP m | 设备 m 卸载任务以保护两种隐私 |
| .Em | 第 m 个无线设备获得的能量 |
| .r∗ L,m | 一个时间槽内的最大本地计算速率 |
| .Dm | 设备 m 的卸载任务大小 |
| .bm | 设备 m 卸载任务所需的时间 |
| .P o m | 设备 m 的发射功率 |
| .r∗ O,m | MEC 服务器的最大计算速率 |
| .Pl,m | 保护位置隐私的奖励 |
| .Pμ,m | 保护使用模式隐私的奖励 |
| .Pm | 设备 m 的隐私保护水平 |

我们假设 .hm 在下行链路和上行链路中相同,并且在一个时间槽内是静态的。无线设备可以在充电的同时本地执行任务。

2. 系统模型
2.1 本地计算模型
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值