Adaptive Backtracking for Privacy Protection in Large Language Models

面向企业隐私保护的自适应回溯机制

在这里插入图片描述

文章总结与翻译

一、文章主要内容

本文聚焦大型语言模型(LLMs)在检索增强生成(RAG)范式下的企业导向隐私保护问题,核心内容围绕“解决现有隐私保护方法的性能损失”与“填补评估数据集空白”两大挑战展开:

  1. 问题提出:当前隐私保护研究多关注用户隐私,却忽视RAG范式下企业内部专有数据库的泄露风险——攻击者可通过构造提示词诱导LLM逐字复现检索到的机密内容,即“企业导向隐私风险”。现有数据清洗、加密等方法会大幅降低模型输出质量,且缺乏专用评估数据集。
  2. 核心方法:ABack机制:提出一种无需训练的自适应回溯方法(ABack),通过三个阶段实现隐私保护:
    • 隐私实体提取:利用LLM从检索内容中提取个人身份信息(PII)等隐私实体,作为泄露监测指标。
    • 实时泄露监测:以逐token方式监测LLM生成过程,结合“前瞻机制”(生成后续m个token验证)判断是否触发隐私泄露。
    • 泄露倾向回溯:设计隐藏状态模型(HSM),定义“中性描述”“模糊隐私规避”“隐私泄露倾向”“已泄露”四种隐藏状态,通过反向推理定位首次出现“隐私泄露倾向”的回溯点,从该点安全重写生成内容,避免性能损失。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值