联邦学习中的动态提示调优技术FedDPG

最新推荐文章于 2025-12-20 23:15:13 发布

原创最新推荐文章于 2025-12-20 23:15:13 发布 · 182 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#联邦学习 #自然语言处理 #动态提示 #程序那些事 #AIGC #语言模型 #人工智能

摘要

预训练语言模型(PLMs)在各种NLP任务中表现出色，但传统微调方法存在高计算成本问题。提示调优作为高效替代方案，仅需在输入序列前添加少量可训练参数，同时冻结PLM参数。然而固定提示会降低模型灵活性。联邦学习(FL)技术虽能解决数据隐私问题，但仍面临客户端通信与计算资源限制的挑战。

方法创新

提出联邦动态提示生成器(FedDPG)，核心创新包括：

动态提示生成网络：根据输入内容生成上下文感知提示
联邦优化框架：在保护数据隐私前提下实现参数高效更新
双阶段训练机制：
- 本地阶段：客户端训练提示生成器
- 聚合阶段：服务器整合全局模型

实验结果

在三个NLP基准数据集上的测试表明：

全局模型性能超越当前最先进的参数高效微调方法
计算时间减少42%
联邦网络传输参数量降低37%
在AGNews、Yelp评论和IMDB数据集上分别取得2.1%、3.4%和2.8%的准确率提升

技术贡献

首次将动态提示生成引入联邦学习场景
设计轻量级提示生成器网络（仅含0.3M参数）
提出差分隐私保护下的梯度聚合方案
实现客户端计算负载均衡算法

应用价值

该技术特别适用于：

医疗健康领域的跨机构NLP协作
金融行业合规文本分析
物联网设备上的实时语言处理
资源受限边缘计算场景
更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）
公众号二维码

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

codeshare1135

关注关注

9
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【Day20240924】联邦学习中的方法改进

weixin_52881828的博客

09-24

2493

几种异步的方法：FedAsync PORT ASO-Fed FedBuff FedSA 几种同步的方法：FedAvg FedProx MOON FedDyn

【联邦学习】理论学习

JingYan_Chan的博客

12-03

6362

联邦机器学习又名联邦学习，联合学习，联盟学习。联邦机器学习是个机器学习框架，能有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下，进行数据使用和机器学习建模。在本章，我们将了解联邦学习的定义、算法原理、分类、短板挑战。联邦学习作为机器学习领域的一种分布式数据处理方法，可以在实现分布式模型训练的同时解决隐私泄露问题。2016年，联邦学习的概念由谷歌提出，其主要思想是基于分布在多个设备上的数据集构建机器学习模型，同时防止数据泄露。杨强教授在2019年。

参与评论您还未登录，请先登录后发表或查看评论

【机器学习】联邦学习技术

2301_79181030的博客

08-22

3640

联邦学习是一种分布式机器学习范式，其核心思想是利用分散在各参与方的数据集，通过隐私保护技术融合多方数据信息，协同构建全局模型。在模型训练过程中，各参与方仅交换模型参数、梯度等中间结果，而本地训练数据则不会离开本地，从而大大降低了数据泄露的风险。自治和联合。自治：各参与方在本地使用自己的数据进行模型训练，得到各自的模型参数。联合：各参与方将本地训练的模型参数上传至中心服务器（或采用去中心化方式），中心服务器进行模型参数的聚合与更新，并将更新后的参数分发回各参与方，进行下一轮迭代。

联邦学习研究综述【联邦学习】

eternity_memory的博客

08-04

4774

联邦学习综述

联邦学习中的数据非独立同分布问题

SmartLab307的博客

10-10

2410

比如在一个图像分类数据集cifar-10中，共有6W张照片分为10类，在传统的图像分类实验中，数据集采用均匀划分的5w个作为训练集，1w个样本作为测试集。在传统的应用场景中，数据存储在中心，机器学习可以获取所有数据的整体信息，但是在联邦学习中，由于数据仅存储在本地，导致数据之间分布的不一致性。在传统的机器学习中，可以把训练集和测试集看成两个客户端，在之前的训练中，我们都是假设这两个客户端是IID的，这是通过训练数据集获得的模型在测试数据集上也能表现较好的重要保障。

联邦学习中的数据异构性

wzx_442011334的博客

10-23

3102

在联邦学习中，异构数据指的是不同客户端的数据分布在特征、标签、样本数量等方面存在差异。这种异质性是联邦学习面临的一大挑战，因为它会影响全局模型的训练效果、稳定性和泛化能力。研究者们通过多种技术手段来应对这一问题，以提升联邦学习的性能和适应性。

联邦学习中的安全聚合SMPC

@毛宏斌

03-24

9455

目录一、背景 1.1 联邦聚合与FedAVG 1.2 FATE 1.3密钥协商（Key Agreement） 1.4秘密共享（Secret Sharing）二、安全聚合SMPC 2.1 原理 2.2 单掩码方案 2.4 双掩码完整方案三、FATE安全聚合（SecureAggregation）的实现 3.1 FATE的安全聚合机制 3.2 FATE安全聚合的实现四、总结记录下联邦学习中的安全聚合机制SMPC。一、背景 1.1 联邦聚合与FedAVG...

联邦学习与可信计算技术TEE、MPC、同态加密的关系

Garvin的专栏

02-10

5249

随着国家对数据安全、数据隐私的要求越来越严格，可信计算越来越受到重视，也会是未来技术发展的重点方向之一。对于这个大众相对比较陌生的领域其实有很多相关的技术，比如TEE、MPC、同态加密等，网上的资料也比较杂，今天分别给大家做下介绍，另外也讲下联邦学习与这些可信计算技术的关系。 3大可信计算技术可信计算指的是通过技术手段保证数据安全性的计算方式。按照不同的技术路线可以分为3种： 1.TEE（Trusted Execution Environment）：基于硬件的可信执行环境计算 2.MPC（M.

纵向联邦学习中的逻辑回归方案介绍

林立可

09-29

3287

纵向联邦学习中的逻辑回归方案 1，传统机器学习里的LR 计算：y′=σ（wx）y^\prime=σ（wx）y′=σ（wx）。w为模型；目标：输入x得到输出。如何训练w：w:=w−g,其中g=(y′−y)xw:=w-g,其中g=(y^\prime-y)xw:=w−g,其中g=(y′−y)x 如何停止：设置迭代次数和loss收敛阈值。 2，纵向联邦里的LR 联邦学习里首先对标签{0,1}改动为{1，-1}。然后为了支持同态，对损失函数做了改动。 2.1，有第三方：全局只有一对公私钥。第三方持有私钥，参

联邦学习隐私计算框架：技术详解与实战指南

shejizuopin的博客

03-24

1393

联邦学习是一种分布式机器学习框架，其核心思想是在不共享原始数据的前提下，允许多个参与方（如设备、组织）协作训练一个共享的全局模型。通过仅交换模型更新（如梯度信息），联邦学习实现了数据隐私保护与模型性能提升的双重目标。联邦学习隐私计算框架为数据隐私保护与模型性能提升提供了有效解决方案。通过掌握联邦学习的原理、实现及在隐私保护中的应用，开发者可以构建安全、高效的分布式机器学习系统。未来，随着技术的不断进步和应用场景的不断拓展，联邦学习有望在更多领域发挥重要作用。

联邦学习+IEEE指导的联邦学习架构

04-19

IEEE Std 3652.1™-2020 是由IEEE计算机学会的学习技术标准委员会制定的一份关于联邦学习架构和应用的指南，旨在为业界提供一套统一的标准和实践建议。该指南首先定义了联邦学习的概念，明确了其不同于传统集中式...

联邦学习介绍（ppt）

03-10

作为人工智能和机器学习的核心技术，联邦学习旨在解决数据孤岛问题，保护数据隐私和安全，同时实现高效、准确的机器学习模型训练。下面是联邦学习的详细介绍： 1. 什么是人工智能？ 人工智能（Artificial ...

联邦学习场景应用研究报告（2022年）.pdf

02-21

本报告由中国信息通信研究院发布，旨在深入探讨联邦学习技术在政务、医疗、金融、广告、物流等领域的应用价值。以下是报告中提到的重要知识点： 1. 联邦学习简介： 联邦学习是一种分布式机器学习方法，旨在保护...

GPT-Neo：开源大型自回归语言模型的实现与影响

拒绝AI玄学，只聊真技术▲

12-15

882

GPT-Neo是人工智能开源运动中的一个里程碑式项目。它成功地回应了业界对GPT-3闭源策略的关切，通过社区协作的方式，证明了构建大规模、高性能开源语言模型的可行性。虽然在绝对性能上未能超越规模最大的私有模型，但GPT-Neo及其衍生模型在性价比、可访问性和可定制性方面具有无可比拟的优势。它不仅在多项基准测试中展现了强大的竞争力，更通过实际研究案例证明了自己作为下游任务基石的实用价值。更重要的是，GPT-Neo为整个研究社区注入了活力，推动了透明、协作的AI发展范式。

【AI】大语言模型基础知识详解

weixin_63434398的博客

12-18

1042

本文通俗讲解了大语言模型(LLM)的核心原理和关键概念。大模型本质上是基于海量文本训练的超大参数神经网络，通过预测"下一个词"来完成文本生成。文章详细介绍了大模型的三大特征：训练数据量巨大(如GPT-3训练3000亿token)、参数量庞大(如GPT-3有1750亿参数)以及由此产生的通用能力。重点解释了token(文本处理基本单位)和词表(模型字典)的概念，并剖析了大模型从输入到输出的完整工作流程：分词→转ID→计算概率→选择最高概率词→循环生成。最后指出大模型并非真正理解语言，而是基

【自然语言处理与大模型】LangChainV1.0入门指南：核心组件Models