
神经网络水印
文章平均质量分 95
_Meilinger_
个人简介:FDU科研达人养成计划|CSC联培博士生|b站/小红薯同名~欢迎各位伙伴关注,希望能与大家共同奋斗,一起进步~
展开
-
文献综述|LM领域水印发展综述
白盒水印:在神经网络的参数中嵌入水印,验证时通过检验模型的权重分布检验水印的存在。黑盒水印:通过后门植入的方法在神经网络的参数中嵌入水印,验证时通过比对模型输出与触发集标签的一致性检验水印的存在。无盒水印:在模型的输出文本中嵌入水印,验证时通过对模型输出文本携带的水印信号进行检测检验水印的存在。其中,白盒水印提取时需要掌握模型的参数信息,黑盒水印和无盒水印提取时只需要获取模型的API即可。原创 2023-10-31 11:19:18 · 1679 阅读 · 0 评论 -
论文研读|An Embarrassingly Simple Approach for Intellectual Property Rights Protection on RNNs
本文提出一种使用白盒或黑盒的方式保护RNN模型版权的鲁棒水印方法,对移除攻击和伪造攻击具有很好的鲁棒性。原创 2023-10-23 20:00:47 · 317 阅读 · 0 评论 -
论文研读|Protect, show, attend and tell: Empowering image captioning models with ownership protection
本文是第一篇提出使用白盒水印的方式保护图像描述生成模型的文章,将水印嵌入到LSTM模型的hidden state 中。原创 2023-10-22 21:43:55 · 291 阅读 · 0 评论 -
论文研读|COSYWA: Enhancing Semantic Integrity in Watermarking Natural Language Generation
本文提出一种基于掩码语言模型的无盒水印方法保护文本生成模型的版权。原创 2023-10-22 17:25:18 · 265 阅读 · 1 评论 -
论文研读|CATER: Intellectual Property Protection on Text Generation APIs via Conditional Watermarks
本文提出一种保护语言模型API的无盒水印方法,能够在保证水印添加前后词汇分布接近的同时,有效验证水印的存在,且本文提出方法能有效抵抗模型窃取攻击。原创 2023-10-20 20:36:16 · 347 阅读 · 0 评论 -
论文研读|PLMmark: A Secure and Robust Black-Box Watermarking Framework for Pre-trained Language Models
本文提出一种基于单向散列函数和对比学习保护预训练语言模型的黑盒水印方法,通过构造触发集,设计损失函数,使得触发样本的输出特征向量与正常样本的输出特征向量不同,水印的保真度与有效性较高,同时能够有效抵抗剪枝与伪造攻击。原创 2023-10-19 20:40:26 · 707 阅读 · 0 评论 -
论文研读|GPTs Don’t Keep Secrets: Searching for Backdoor Watermark Triggers in Autoregressive LMs
这篇文章通过实验验证了使用构造触发集的方法向自回归语言模型中植入后门作为黑盒水印的难度。原创 2023-10-18 19:59:07 · 234 阅读 · 0 评论 -
论文研读|A novel watermarking framework for intellectual property protection of NLG APIs
本文提出一种保护文本生成模型API的无盒水印方法,通过对模型api生成的内容进行语义相似度限制的修改,在保护模型原始性能的同时借助假设检验判断水印的存在。原创 2023-10-17 20:56:18 · 257 阅读 · 0 评论 -
论文研读|TextBack: Watermarking Text Classifiers using Backdooring
本文提出一种使用黑盒水印方式保护文本分类模型的方法。通过构建触发集,将其混入干净训练数据微调预训练模型,嵌入水印。原创 2023-10-17 18:49:34 · 336 阅读 · 0 评论 -
论文研读|Protecting Intellectual Property of Language Generation APIs with Lexical Watermark
本文提出一种保护文本生成模型API的无盒水印方法,通过对模型api生成的内容进行语义保留的修改,在保护模型原始性能的同时借助假设检验判断水印的存在。原创 2023-10-17 12:53:32 · 313 阅读 · 0 评论 -
论文研读|Watermarking the Outputs of Structured Prediction with an application in SMT task
本文提出一种保护统计机器翻译模型的无盒水印方法,通过对输出结果进行概率分布统计,验证水印的存在。实验证明,该方法能够有效抵抗局部编辑攻击操作。原创 2023-10-16 12:52:51 · 215 阅读 · 0 评论 -
论文研读|Robust Black-box Watermarking for Deep Neural Network using Inverse Document Frequency
本文开创性地提出一种基于TF-IDF的保护文本分类模型的黑盒水印方法,根据文档中词的重要性构建触发集,训练模型并嵌入水印。原创 2023-10-15 20:35:55 · 635 阅读 · 0 评论 -
论文研读|How to Prove Your Model Belongs to You: A Blind-Watermark based Framework ...
本文提出盲模型水印的概念,旨在生成视觉差异不可感知性的触发集。通过Auto-Encoder使得触发集中水印图像的分布更加接近原始训练数据中的图像,并借鉴生成对抗网络的概念,添加判别器,拟合水印图像与原始图像的分布。原创 2023-10-13 13:13:27 · 552 阅读 · 0 评论 -
论文研读|Robust Watermarking of Neural Network with Exponential Weighting
本文首先针对黑盒水印提出了一种基于Anto-Encoder的查询修改攻击,并有针对性地提出了一种更加鲁棒的clean-image触发集构造方法和基于参数指数增强的黑盒水印模型训练方法,能够有效抵御模型修改攻击(Pruning)和查询修改攻击。原创 2023-10-12 17:40:41 · 410 阅读 · 0 评论 -
论文研读|Turning Your Weakness Into a Strength: Watermarking Deep Neural Networks by Backdooring
本文提出一个使用后门攻击的方式为嵌入水印的框架,并通过理论分析证实了方法的可行性。原创 2023-10-11 22:50:14 · 846 阅读 · 1 评论 -
论文研读|Watermarking Deep Neural Networks for Embedded Systems
本文提出一种黑盒水印方法,同样借鉴后门攻击的思想,通过设计基于作者签名的水印生成器和目标标签构造触发集,将模型置于触发集与原始数据集上训练,得到含有水印的模型。原创 2023-10-11 15:47:00 · 811 阅读 · 0 评论 -
论文研读|Protecting Intellectual Property of Deep Neural Networks with Watermarking
本文是第一篇提出「黑盒模型水印」的文章,文章借鉴模型后门攻击的思想,通过构造触发集的方式,将水印嵌入到模型中;在版权验证阶段,验证者通过输入触发集中的图片,验证水印的存在与否。原创 2023-10-08 20:18:07 · 1682 阅读 · 2 评论 -
文献综述|CV领域神经网络水印发展综述
本文介绍CV领域神经网络水印的研究现状。原创 2023-10-07 18:54:17 · 5102 阅读 · 5 评论