音频水印、TCP性能优化与网页会话聚类技术解析
基于沃尔什 - 哈达玛变换的鲁棒盲音频水印
在音频水印技术中,所有权信息通过三个不同的 32x32 二进制标志图像(分别记为 w1、w2 和 w3)来表示。这些标志图像首先使用阿诺德变换进行置换,然后转换为一维的 0 - 1 比特流。添加同步码后,利用冗余因子 r = 3 进行复制。
数据有效载荷(D)指的是在单位时间内嵌入音频信号的比特数,单位为 bps(比特每秒)。对于包含 32 个样本的帧,估计的数据有效载荷为 1378 bps。在不应用任何冗余的情况下,嵌入一个 16 位同步码(1111100110101110)和一个 32x32 二进制水印需要约 0.7546 秒的音频片段;当 r = 3 时,则需要约 2.2639 秒。
为了实现对不同攻击的良好鲁棒性,所有音频文件的嵌入强度(S)设置为 500。为了衡量不可感知性,使用信噪比(SNR)作为客观指标,基于平均意见得分(MOS)的听力测试作为主观指标。计算得到的 SNR 分别为:A1 为 29.49dB,A2 为 26.92dB,A3 为 28.69dB。SNR 仅在实际嵌入水印比特的音频信号部分进行计算。通过 10 名听众参与的听力测试来估计带水印音频信号的主观 MOS 等级,平均等级几乎等于 5.0(MOS 等级 = 5.0 表示完全不可感知,MOS 等级 = 0.0 表示带水印音频质量非常差)。
在鲁棒性测试方面,使用原始水印和提取水印之间的归一化相关性(NC)和误码率(BER)作为鲁棒性的客观指标。对带水印的音频信号进行了几种标准音频处理攻击,以评估所提出的水印方案的鲁棒性,结果如下表所示:
| 攻击类型 | BER (%) | NC
超级会员免费看
订阅专栏 解锁全文
1534

被折叠的 条评论
为什么被折叠?



