化学结构集的数字水印技术
1 系统概述
在化学结构集的数字水印系统中,首要目标是确保水印检测器能实现完美同步。水印消息 m
由二进制元素向量 u
表示,其中 un ∈ {0, 1}
。 u
可包含多种信息,如版权所有者的标识符、验证位向量 f
以及分子数据的计算日期等。水印嵌入依赖于密钥 K
,该密钥仅版权所有者和可能的可信第三方知晓。为提高检测可靠性,使用纠错码将 u
编码为长度为 Luc
的二进制向量 uc
。
2 结构预处理
2.1 结构归一化与哈希计算
为嵌入或检测水印,需对结构进行归一化和识别。仅部分编码后的水印消息会嵌入到单个结构中,具体嵌入的消息部分由该结构生成的哈希码决定。哈希码仅依赖于结构描述,因此水印的编码和解码过程与大型数据集中结构的顺序无关。插入未标记记录和删除标记记录在较大程度上是可接受的,因为额外或缺失的结构只会降低检测可靠性,不会导致同步问题。
使用的是最先进的 64 位哈希码,它在一些方面优于早期的尝试。由于哈希码依赖于氢原子的添加状态,在计算哈希之前会向结构中添加标准氢原子集。若已有氢原子,此操作为空;否则添加具有未定义或至少未标记坐标的新原子。这些添加的原子会降低检测可靠性,但能确保原始结构哈希码的再生和原始规范原子顺序的获取。
获取编码消息部分后,将结构移动到唯一的 3D 方向并生成原子的规范顺序。原子的规范顺