- 博客(9)
- 收藏
- 关注
原创 文本水印知识总结
(1)不同文本水印技术的概述和比较;(2)文本水印算法的评价方法,包括可检测性、对文本的影响或LLM质量的影响、目标攻击的鲁棒性或非目标攻击;(3)文本水印技术的潜在应用场景;(4)文本水印的当前挑战和未来方向。大语言模型(large language models,LLMs)的迅速发展,产生了一下问题:(1)LLM 的误用:恶意用户可以利用 LLM 来创建错误信息 [13] 或有害内容 [76] 并在互联网上传播。
2025-03-30 20:02:35
563
原创 模型水印知识框架
Uchida等人的工作在共谋攻击中存在弱点,因此,提出了一种由用户和模型共同确定的端到端系统指纹框架DeepMarks.DeepMarks在保证模型性能不会大幅下降的基础上每个用户分配一个唯一的二进制代码向量(也称为指纹),并将指纹信息嵌入模型权重的概率分布中,能够有效地跟踪每个用户模型的使用情况.[74]由于在模型的内部权重中嵌入水印容易被攻击者移除和检测,从而使所有权保护失效,因此,研究者提出了基于内部结构的白盒水印方法,即更改目标模型的内部结构来达到嵌入水印的目的。具体而言,原始模型预测𝑁−1。
2025-03-21 21:59:43
676
原创 (代码)SSLGuard:自监督预训练编码器水印方案
SSLGuard的目标是将基于给定秘密向量的水印注入到干净的SSL编码器中。SSLGuard的输出包含一个带水印的编码器和一个键元组。具体来说,键元组由秘密向量、验证数据集和解码器组成。SSLGuard将干净的编码器微调到一个带水印的编码器,该编码器可以保持验证数据集中的效用和映射样本到秘密嵌入。我们进一步引入了一个解码器将这些秘密嵌入转换为秘密向量。对于其他编码器,解码器仅将从验证数据集生成的嵌入转换为随机向量。最近的研究表明,如果一个水印模型被盗,其对应的水印通常消失。
2025-02-27 22:41:58
187
原创 自监督学习预训练编码器的水印方案-SSLGuard: A Watermarking Scheme for Self-supervised Learning Pre-trained Encoders
具体来说,我们首先训练一个包含验证数据集和秘密向量信息的带水印编码器。Clean编码器用作基于查询的 API 来指导训练过程。阴影编码器用于模拟模型窃取过程,以更好地保存模型窃取攻击下的水印。带水印的编码器在保持注入水印的同时,应保持干净编码器的效用。防御者应该准备私有数据集DpD_pDp、掩码MMM和随机触发器TTT。掩码MMM是一个二进制矩阵,包含触发器TTT的位置信息,这意味着MMM和TTT与私有样本xpx_pxp具有相同的大小。我们将触发器注入到x。
2024-12-30 21:56:39
1064
原创 DAWN:DynamicAdversarial Watermarking of Neural Networks 神经网络的动态对抗性水印
模型提取盗窃是一种攻击方式,攻击者通过查询受保护的机器学习模型并利用其返回的输出结果,试图重建出模型的内部结构、参数或行为,从而窃取模型的知识和技术。攻击者可能不直接获得目标模型的权重或代码,而是通过查询模型,尤其是在API等黑盒环境下,获取足够的信息以构建一个“仿制”模型,来达到窃取其知识产权或进行其他恶意操作的目的。计算了攻击者在没有知道水印秘密的情况下,随便尝试验证一个模型是否含有水印并成功的概率。指API 客户端提出的N个输入中要进行水印处理的比例,触发集的大小为。
2024-11-28 17:43:41
767
原创 模型水印综述
1.为什么需要对深度学习模型进行保护?答:避免对手可以在不尊重合法方的知识产权 (IP) 的情况下非法下载、窃取、重新分配或滥用经过训练的 DNN 模型,从而导致模型所有者的严重损失。因此,为了防止这种恶意攻击,迫切需要开发机密但稳健地保护训练模型及其IP的方法,增强DNN模型的可信度。识别是目前 DNN IP 保护的两个主要技术。3.什么是:深度水印[26]将一些独特的识别信息嵌入到输入中,模型本身(模型参数、梯度、结构等)或输出。4.什么是。
2024-11-02 01:54:07
1660
原创 图解密码技术-第四章:分组密码的模式(迭代方式)
1.分组密码的模式:DES、AES是分组密码,只能加密固定长度的明文。想要加密任意长度的明文,需要对分组密码进行迭代,分组密码的迭代就是分组密码的“模式”。2.分组密码和流密码:分组密码指每次只能处理特定长度的一块数据的一类密码算法,这里的“一块”指的是分组,一个分组的比特数就称为分组长度。流密码指对数据流进行连续处理的一类密码算法。流密码一般以1比特、8比特或32比特等为单位进行加密和解密。流密码是对一串数据流进行连续处理,因此需要保持内部状态。3.明文分组和密文分组:明文分组:明文分组指的是分组密码算法
2024-04-19 19:52:38
937
1
原创 图解密码技术-第三章知识点总结(对称密码)
1.比特序列密码:0和1排列而成的比特序列。编码:比特序列的操作称为编码。2.XOR(异或):运算符号为⨁,与加法运算相似,但是不需要进位。比特序列之间的XOR运算。 由于两个相同的数进行XOR运算的结果一定为0,因此如果将A⨁B的结果再与B进行 XOR运算,则结果会变回A。也就是两个公式中的B会相互抵消。∙将明文A用密钥B进行加密、得到密文A⨁B∙将密文A⨁B用密钥B进行解密,得到明文A。
2024-04-13 16:26:22
728
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人