27、智能交通系统中基于联邦学习的隐私保护移动众包感知

最新推荐文章于 2025-10-05 11:01:54 发布

原创最新推荐文章于 2025-10-05 11:01:54 发布 · 61 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#联邦学习 #智能交通系统 #移动众包感知

智能驾驶的未来之路专栏收录该内容

27 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

智能交通系统中基于联邦学习的隐私保护移动众包感知

1. 研究背景与相关工作

智能交通系统中的移动众包感知意义重大，此前已有诸多优秀成果。例如，有的工作实现了基于隐私保护的声誉管理和用户恶意行为预防机制；有的设计了基于区块链的群体感应机制以实现位置隐私保护；还有的结合机器学习和区块链技术设计新的隐私保护机制等。

不过，现有工作虽能实现移动众包感知中的用户隐私保护，但仍面临挑战：
- 如何改变移动众包感知中的数据聚合方法以实现用户隐私保护。
- 怎样将区块链与众包感知结合，在保护用户隐私的同时确保用户提供真实数据。

为应对这些问题，提出了基于联邦学习的众包感知机制，能有效提高移动众包感知质量并保护用户隐私。

2. 系统模型

将传统移动众包感知的数据聚合转变为数据模型的聚合，以保护数据所有者的隐私。愿意聚合相关数据的用户以团队形式响应任务，团队领导者指导和监督团队内的数据模型聚合。最终聚合的数据模型将存储在区块链上，并提供给同一任务的下一个数据发布者。该解决方案架构包含以下四个流程：
1. 各区域的数据请求者发布移动众包感知任务，如识别智能交通环境中的建筑物和障碍物。
2. 数据所有者以团队形式响应众包感知任务。
3. 团队训练数据模型并将模型交付给数据请求者。
4. 数据请求者提供相应的任务奖励。

同时，考虑到以下安全威胁：
- 不诚实的团队成员可能提供虚假或恶意的数据模型，部分不可信成员可能中途退出训练，影响最终数据模型质量。
- 任务发布者可能对团队成员隐私感兴趣，若团队仅提供未受隐私保护的数据模型，任务发布者有一定概率推断出数据所有者的隐私数据。

针对这些威胁，通过团队领导者监督数据模型训练过程，并向数据模型添加噪声来保护团队成员隐私。

3. 基于联邦学习的众包感知

3.1 团队参与的数据聚合

为确保数据请求任务高质量完成，提出新的区块链注册方法，每个数据收集者注册为团队成员响应众包感知任务，一定程度上改善了信任关系和任务完成效率。当任务发布者发布感知任务时，符合要求的团队响应。团队发起者发起团队信息聚合，设定聚合响应截止日期、工作任务和成员要求。数据团队领导者与任务发布者签订协议的流程如下：

Algorithm 4 Signing the contract
Require: Data sharing task Ts, completion time T, task requirements Re, task rewards Tr
Ensure: Signed contract
A team of users respond to the task
The team leader and the data requester sign the protocol with their private keys Pk.
Crowdsensing platform acts the supervisor of protocol implementation
Contract signed.

3.2 数据模型聚合过程

多数现有方法通过加密数据进行聚合，但加密原始数据会降低最终聚合数据的可用性。在分布式环境中，聚合数据模型更安全高效，既能实现数据聚合目的，又能保护数据收集者隐私。具体数据模型聚合方案如下：
1. 任务发起者发起移动众包感知任务，包含任务细节、奖励和时间戳，用私钥签名。发布到区块链时验证身份，检索是否有处理记录，有则返回结果，无则发布任务。
2. 用户以团队形式响应任务，团队领导者决定是否接受，团队成员进行联邦学习训练全局模型。成员先训练本地数据模型，再发送给团队领导者，领导者聚合后返回给成员，重复此过程直到达到最大训练时间。
3. 所有聚合视为聚合交易，由交易记录节点打包成块生成聚合交易记录。
4. 团队成员进行共识过程，竞争写入交易到块的机会，获得记账权的节点广播块供其他数据节点验证，通过后添加到区块链。

为保护团队成员隐私，在联邦学习过程中，成员向自己提供的数据模型添加差分隐私噪声，确保团队领导者聚合的数据模型也具有隐私保护功能。

以下为数据模型聚合过程的流程图：

graph LR
    A[任务发起者发起任务] --> B[验证身份并发布任务]
    B --> C[用户以团队响应任务]
    C --> D[团队成员训练本地模型]
    D --> E[发送本地模型给领导者]
    E --> F[领导者聚合模型]
    F --> G[返回聚合模型给成员]
    G --> H{达到最大训练时间?}
    H -- 否 --> D
    H -- 是 --> I[聚合交易打包成块]
    I --> J[团队成员共识过程]
    J --> K[验证通过添加到区块链]

3.3 团队信用管理

联邦学习聚合后，根据最终聚合模型在测试集上的准确性进行信用奖励或惩罚。假设任务发布者要求的准确率为 Ar，最终聚合模型的测试准确率需大于 Ar。信用奖励划分方式如下：
- 若团队中 m 个成员的准确率超过 Ar，其余 n - m 个成员未达到，则仅奖励这 m 个成员，每个成员的奖励为：
[R_i = \frac{acc_i - A_r}{\sum_{i = 1}^{m}(acc_i - A_r)} \cdot R_{total}]
其中 (acc_i) 是成员 i 的测试准确率，(R_{total}) 是总奖励。
- 若最终聚合模型的测试准确率低于要求，但团队中 m 个成员的测试准确率大于要求，其余 n - m 个成员小于要求，则仅惩罚这 n - m 个成员，具体罚款计算如下：
[P_i = \frac{acc_i - A_r}{\sum_{i = 1}^{n - m}(acc_i - A_r)} \cdot P_{total}]
其中 (P_{total}) 是总惩罚。

团队有领导者和成员两个角色，领导者责任更多，成功完成任务时应获得更多奖励，任务失败时也应受到更多惩罚，以此激励团队提供更好的数据模型。

4. 性能评估

4.1 模拟设置

实验在配备 Windows 7 系统、Intel Core i7 处理器（CPU 频率 6.4 GHz）的计算机上完成，使用 Python 编程语言验证方案有效性。实验采用 MNIST 数据集，该数据集来自美国国家标准与技术研究院（NIST）。训练集由 250 个不同人的手写数字组成，其中 50% 是高中生，50% 是人口普查局的工作人员。测试集也是相同比例的手写数字数据，但确保测试集和训练集不相交。MNIST 数据集共有 70,000 张图像，其中 60,000 张是训练集，10,000 张是测试集。每张图片由 28*28 的 0 - 9 手写数字图片组成，图片为黑底白字，黑色背景用 0 表示，白色文字用 0 - 1 之间的浮点数表示，越接近 1 颜色越白。

4.2 实验结果

模型训练 ：通过观察本地数据模型训练过程中的损失曲线和联邦学习数据模型聚合的准确率曲线发现，当本地训练轮数达到 60 时，损失曲线面积稳定，这表明基于团队的数据模型训练具有较高效率。随着联邦学习轮数的增加，训练准确率逐渐提高，最终收敛到约 97% 的准确率。以下是相关数据的表格展示：
| 训练轮数 | 损失曲线情况 | 训练准确率 |
| ---- | ---- | ---- |
| 小于 60 | 不稳定 | 逐渐上升 |
| 60 | 稳定 | 约 97% |
系统性能 ：构建 Hyperledger Fabric 来验证策略性能，根据方案编写相关智能合约，基于团队成员的贡献竞争记账权，并设置每四秒生成一个块。通过观察策略在流量状况、内存使用、磁盘使用和 CPU 使用方面的表现，发现流量状况随时间波动，最高出口和入口流量分别达到 1800B/S 和 1200B/S，说明该策略具有良好的负载平衡能力。不同团队的内存和磁盘使用情况不同，且随着时间的增加，各团队对磁盘的利用率显著下降，体现了该策略在资源利用方面的优势。不同地区执行众包感知任务的团队 CPU 利用率差异明显，虽然 CPU 利用率随时间波动较大，但最高利用率不超过 200%，这意味着该策略不会对团队成员用于训练本地数据模型的设备造成巨大影响。以下是系统性能指标的表格：
| 性能指标 | 表现情况 |
| ---- | ---- |
| 流量状况 | 随时间波动，最高出口 1800B/S，入口 1200B/S |
| 内存使用 | 不同团队不同 |
| 磁盘使用 | 随时间利用率显著下降 |
| CPU 使用 | 不同地区团队差异明显，最高不超 200% |

5. 结论

提出了一种基于联邦学习的安全移动众包感知机制，该机制允许用户以团队形式完成移动众包感知任务。团队领导者通过联邦学习聚合团队成员提供的数据模型，并监督成员训练过程。团队成员通过向数据模型添加干扰噪声进一步保护隐私。根据每个成员提供的数据模型的准确率分配任务完成奖励和失败惩罚，激励团队成员提供可靠真实的数据，实现系统中数据聚合过程的安全性和可靠性。在防止推理攻击的情况下，能够保证干扰后模型的可用性。与传统方案相比，该数据聚合方案在隐私保护和数据质量提升方面具有更好的效果。实验结果表明，该策略在智能交通的路况识别准确性方面表现良好。

以下是整个机制的关键流程总结流程图：

graph LR
    A[数据请求者发布任务] --> B[数据所有者团队响应]
    B --> C[团队训练数据模型]
    C --> D[团队领导者聚合模型]
    D --> E[添加隐私噪声]
    E --> F[交付模型给请求者]
    F --> G[根据准确率分配奖惩]