自然语言水印:设计、分析与概念验证实现
1. 引言
自然语言(NL)水印与图像、视频或软件水印不同,它将隐藏的水印嵌入自然语言文本中,但基本原则是相同的,即水印应具有弹性、除文本作者/所有者外不可检测、易于由水印软件生成等。本文描述并分析了一种自然语言水印方案,并介绍了原型实现的当前状态。构建此应用需要多种不同技术,包括树编码、加密工具以及特殊约束的部分自然语言分析和生成。
1.1 问题定义
设 T 为自然语言文本,W 是比 T 短得多的字符串。我们希望生成自然语言文本 T’,满足以下条件:
- T’ 与 T 基本具有相同的含义。
- T’ 包含 W 作为秘密水印,并且 W 的存在在法庭上应能成立(例如,W 可以表示“这是 X 的财产,于日期 Z 授权给 Y”),这意味着“误报”的概率应极低。
- 没有引入 W 时使用的秘密密钥,就无法从 T’ 中读取水印 W。
- 对于知道秘密密钥的人,可以在不知道 T 的情况下从 T’ 中获取 W,因此无需永久存储原始的未加水印的文本副本。
- 除非有人知道秘密密钥,否则很难在不大幅改变 T’ 含义的情况下从 T’ 中删除 W。
- 引入 W 以获得 T’ 的过程不是秘密,而是秘密密钥赋予了该方案安全性。
- 对于拥有同一文本不同水印版本的两个人的勾结行为具有内置抗性。
1.2 对手模型
对手的目标是在不大幅改变隐藏水印的自然语言文本含义的情况下破坏(理想情况下是销毁)水印。为此,对手可以:
- 对句子进行保留意义的转换(包括翻译成另一种语言)。
- 对句子进行改变意义的转换(但由于要求不能破坏文本的整体意
超级会员免费看
订阅专栏 解锁全文
995

被折叠的 条评论
为什么被折叠?



