44、利用扩频技术实现公共音频通道上的稳健隐蔽通信

最新推荐文章于 2025-08-23 14:37:57 发布

pluto

最新推荐文章于 2025-08-23 14:37:57 发布

阅读量36

点赞数

CC 4.0 BY-SA版权

分类专栏：探索信息隐藏技术的前沿进展文章标签：扩频技术音频水印隐蔽通信

本文链接：https://blog.youkuaiyun.com/pluto/article/details/149870779

探索信息隐藏技术的前沿进展专栏收录该内容

49 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

利用扩频技术实现公共音频通道上的稳健隐蔽通信

1. 引言

在音频版权保护方面，传统的数据保护技术（如加密或加扰）并不适用，因为音频最终会以未加扰或解密的格式播放，使得内容可以被轻易录制。为了应对这种情况，在音频内容中插入水印成为了一种有效的解决方案。水印可以携带隐蔽信息，用于音频的追踪和识别。

水印方案主要依赖于人类听觉系统（HAS）的特性。许多秘密隐藏技术利用了HAS对小幅度变化不敏感的特点，包括时域和频域的变化，以及低幅度时域回声的插入。信息调制通常采用扩频（SS）或量化索引调制（QIM）技术。QIM通过交错量化器对信号进行量化来隐藏数据，而扩频技术则是在信号中加入低幅度的扩频序列，并通过相关技术进行检测。

然而，传统的水印系统存在一些问题，如对检测器失同步的耐受性较差，以及在水印解码过程中缺乏有效的应对方法。为了解决这些问题，本文提出了一系列新颖的扩频水印技术，显著提高了在时间和音高波动情况下水印检测的鲁棒性。

2. 初步讨论

在选择数据隐藏技术时，我们对比了扩频（SS）、量化索引调制（QIM）和回声隐藏三种技术，最终选择了扩频技术，原因如下：
- QIM ：对非线性域缩放敏感，并且依赖于量化器的保密性。一旦量化器被泄露，干扰检测器的噪声强度将与原始信号修改的强度相同。
- 回声隐藏 ：对额外回声和回声衰减等操作过于敏感，这些操作可以通过类似盲反卷积的技术实现。

扩频技术在信号处理方面具有更高的鲁棒性，只要能显著降低其对失同步的敏感性。

设原始信号向量为 $\vec{x}$，对应的水印向量为 $\vec{w}$，水印后的向量为 $\vec{y} = \vec{x} + \vec{w}$。水印 $\vec{w}$ 是由元素 $w_i$ 组成的序列，$w_i$ 有两个等概率的值 ${-\Delta, +\Delta}$，且与 $\vec{x}$ 独立生成。水印通过版权所有者的秘密密钥初始化的伪随机比特生成器生成，参数 $\Delta$ 应根据HAS对幅度变化的敏感性进行设置。

相关检测器通过以下公式对水印的存在进行最优测试：
[C = \vec{y} \cdot \vec{w} = (\vec{x} + \vec{w}) \cdot \vec{w} = \vec{x} \cdot \vec{w} + \vec{w} \cdot \vec{w} = \vec{x} \cdot \vec{w} + N\Delta^2]
其中，$N$ 是向量的基数，两个向量 $\vec{u}$ 和 $\vec{v}$ 的相关性定义为 $\vec{u} \cdot \vec{v} = \sum_{i} u_i v_i$。由于原始音频片段 $\vec{x}$ 可以建模为高斯随机向量，归一化相关测试值可以表示为：
[Q = \frac{C}{N\Delta} = \frac{\vec{x} \cdot \vec{w}}{N\Delta} + \Delta]
当水印存在时，$\rho = 1$；否则，$\rho = 0$。最优检测规则是当 $Q > T$ 时判定水印存在，阈值 $T$ 的选择控制着误报和检测概率之间的权衡。

扩频水印的优点包括：测试水印不需要原始音频，并且对可建模为加性或乘性噪声的攻击具有出色的抗性。缺点是在计算相关时，水印信号和水印必须完全同步，并且为了获得足够小的错误概率，向量长度 $N$ 可能需要很大，从而增加了检测的复杂度和延迟。

3. 稳健的扩频隐蔽通信

在开发的音频水印系统中，向量 $\vec{x}$ 由调制复叠变换（MCLT）的几个帧的dB幅度组成。MCLT是一个2倍过采样的DFT滤波器组，结合分析和合成窗口可以实现完美重建。添加水印后，通过将标记向量 $\vec{y}$ 与 $\vec{x}$ 的原始相位相结合，并将修改后的帧通过逆MCLT，生成时域水印音频信号。对于典型的44.1 kHz采样，使用长度为2048的MCLT，仅修改和考虑2 - 7 kHz子带内的MCLT系数，以减少载波噪声的影响以及对下采样和压缩的敏感性。

3.1 心理声学频率掩蔽：后果与补救措施

水印检测器应仅将可听频率幅度与水印进行相关，因为频域中的不可听部分更容易受到攻击噪声的影响。攻击者可以通过移除频谱中的不可听部分来降低版权证明的有效性。为了量化特定频率幅度的可听性，使用了一个简单的心理声学频率掩蔽（PAFM）模型。

PAFM滤波会导致扩频序列不平衡的问题。当嵌入“1”芯片（$w_i = +\Delta$）时，不可听频率幅度 $x_i$ 可能变为可听；当嵌入“0”芯片（$w_i = -\Delta$）时，可听幅度 $x_i$ 可能变为不可听。这种不平衡会影响相关测试的收敛性。

为了解决这个问题，提出了一种改进的协方差测试。假设由“1”和“0”扩频芯片选择的可听部分 $\vec{x}$ 的均值和方差分别为 $\mu_1$、$\sigma_1^2$ 和 $\mu_0$、$\sigma_0^2$，则相关测试可以重写为：
[C = \sum_{i: w_i = +\Delta} y_i w_i - \sum_{i: w_i = -\Delta} y_i w_i = \Delta \sum_{i: w_i = +\Delta} y_i - \Delta \sum_{i: w_i = -\Delta} y_i]
[Q = \frac{C}{N\Delta} = \frac{\rho}{2} + \frac{\mu_r}{N\Delta}]
其中，$\mu_r = \xi \mu_1 + (1 - \xi) \mu_0$，$\xi$ 是“1”和“0”芯片数量的相对差异。

通过计算 $\mu_1$ 和 $\mu_0$ 的均值，并根据 $\mu_1 - \mu_0$ 的值进行补偿，可以提高水印检测的准确性。

3.2 抗失同步攻击的机制

上述相关度量只有在检测芯片与标记芯片完全对齐时才可靠。恶意攻击者可能会通过时间或频率缩放修改来破坏这种同步。为了应对这种攻击，采用了冗余芯片编码的方法。

将每个扩频序列芯片扩展到 $R$ 个连续样本上，在检测过程中，仅使用每个 $R$ 元组的中心样本进行相关计算。这样，即使在水印域中引入了 $\lfloor R/2 \rfloor$ 个样本的线性移位，相关结果仍然是正确的。

为了设置水印搜索机制的上限，对音频剪辑的缩放采用了以下自由度：
- 静态时间缩放：$\pm 10\%$
- 时间缩放方差：$\pm 1\%$
- 静态频率缩放：$\pm 5\%$
- 频率缩放方差：$\pm 1\%$

通过在编码过程中引入冗余，使得攻击者必须引入超过预定义限制的频率和时间移位才能绕过保护机制。

扩频序列可以表示为矩阵 $W = {w_{ij}}$，其中 $\varphi$ 是每个MCLT块中的芯片数量，$\lambda$ 是每个水印中 $\varphi$ 个芯片块的数量。在单个MCLT块中，每个芯片 $w_{ij}$ 扩展到 $F_i$ 个连续频率幅度的子带中，并在 $T_j$ 个连续的MCLT块中沿时间轴复制。

编码区域的宽度 $F_i$ 使用几何级数计算：
[F_i = F_i’ + F_i’’ + \delta_F]
[F_i’ \geq F_{i - 1}’ + VF \cdot F_{i - 1}’]
[F_i’’ \geq F_{i - 1}’’ + F_{i - 1}’ + VF \cdot F_{i - 1}’‘]
其中，$\delta_F$ 是解码区域的宽度，$VF’ \geq VF$ 是对波动音高缩放的期望鲁棒性。

水印的长度 $\lambda_0$ 由以下公式限制：
[\lambda_0 < \frac{T_0 - \delta_T}{VT}]
其中，$\delta_T$ 是时间轴上解码区域的宽度，$T_0$ 的下限设置为100 ms，以提高对样本裁剪或插入的鲁棒性。

以下是一个简单的mermaid流程图，展示了水印嵌入和检测的主要流程：

graph LR
    A[原始音频信号] --> B[MCLT变换]
    B --> C[生成水印序列]
    C --> D[水印嵌入]
    D --> E[逆MCLT变换]
    E --> F[水印音频信号]
    F --> G[检测前处理（PAFM）]
    G --> H[相关检测]
    H --> I[判断水印是否存在]

综上所述，本文提出的扩频水印技术通过引入冗余、改进协方差测试和抗失同步机制，显著提高了水印检测的鲁棒性和可靠性，能够在音频受到多种攻击的情况下仍然准确地检测到水印。这些技术有望应用于高保真数字音乐的版权保护系统中。

利用扩频技术实现公共音频通道上的稳健隐蔽通信

3.3 隐蔽消息嵌入与安全增强

为了进一步提高隐蔽通信的安全性和可靠性，我们开发了一种将稳健隐蔽消息嵌入到已用扩频芯片序列水印的音频剪辑中的技术。该技术通过伪随机地将隐蔽消息位分散到扩频序列上，来增强单个隐蔽位的安全性，并减少载波方差突发对单个消息位检测可靠性的影响。

具体来说，我们将隐蔽消息位与扩频芯片序列进行组合，并在时间上进行置换。如图4所示，首先将隐蔽消息位与对应的扩频芯片块相乘，然后对每个频率子带的消息位沿时间轴进行置换。

以下是隐蔽消息嵌入和置换的主要步骤：
1. 消息与芯片块相乘 ：将隐蔽消息位 $m_k$ 与对应的扩频芯片块 $w_k$ 相乘，得到新的芯片块 $m_k \cdot w_k$。
2. 消息位置换 ：对每个频率子带的消息位进行独立的置换，增加消息的安全性。

通过这种方式，即使音频信号受到攻击，由于消息位在扩频序列上的分散分布，单个消息位的检测可靠性也能得到保障。

4. 系统实现与性能验证

为了验证所开发技术的有效性，我们实现了一个数据隐藏系统。该系统能够在音频受到多种攻击的情况下，以高可靠性检测到隐蔽消息。

4.1 系统实现

系统的实现主要包括以下几个部分：
1. 水印生成 ：使用版权所有者的秘密密钥初始化伪随机比特生成器，生成水印序列。
2. 水印嵌入 ：将水印序列嵌入到音频信号的MCLT系数中，通过逆MCLT变换生成水印音频信号。
3. 水印检测 ：在检测前进行PAFM滤波，然后使用改进的协方差测试和冗余芯片编码进行水印检测。
4. 隐蔽消息提取 ：在检测到水印后，通过置换逆操作提取隐蔽消息。

4.2 性能验证

实验结果表明，即使音频受到上述多种攻击的组合，系统仍然能够以高可靠性检测到隐蔽消息。这说明我们的技术能够有效应对各种信号处理攻击，保障音频版权的安全。

以下是一个mermaid流程图，展示了系统的整体实现流程：

graph LR
    A[原始音频] --> B[水印生成]
    B --> C[水印嵌入]
    C --> D[水印音频]
    D --> E{是否受到攻击?}
    E -- 是 --> F[攻击处理]
    E -- 否 --> G[水印检测]
    F --> G
    G --> H[隐蔽消息提取]
    H --> I[输出结果]

总结

本文提出了一套用于公共音频通道上扩频水印的新颖技术，显著提高了水印检测在存在波动时间和音高缩放情况下的鲁棒性。主要贡献包括：
1. 改进的协方差测试 ：解决了心理声学频率掩蔽导致的扩频序列不平衡问题，提高了水印检测的准确性。
2. 冗余芯片编码 ：有效抵抗了失同步攻击，确保在水印域中引入一定线性移位时相关结果仍然正确。
3. 隐蔽消息嵌入技术 ：通过伪随机地将隐蔽消息位分散到扩频序列上，增强了单个隐蔽位的安全性和检测可靠性。

实验结果表明，这些技术能够在音频受到多种攻击的情况下，以高可靠性检测到隐蔽消息。因此，我们相信这些技术可以集成到有效的高保真数字音乐版权保护系统中，为音频版权的安全提供有力保障。