DCT域鲁棒图像水印系统论文精读:《A DCT-domain system for robust image watermarking》

第一章 引言

网络化多媒体系统由于存储和传输的信息量不断增加而日益受到欢迎,当电子商务、互动电视、远程办公等先进多媒体服务广泛普及时,这种扩展将以更加陡峭的速度继续。网络化多媒体服务发展的一个限制因素是作者、出版商和多媒体数据提供商对于在网络环境中分发其文档表现出谨慎态度,因为数字数据在其精确的原始形式中易于复制的特性可能会鼓励版权侵犯。事实上,网络化多媒体系统的未来发展取决于开发有效方法来保护数据所有者免受未经授权的复制和网络上材料的重新分发。

虽然加密系统并不能完全解决问题,因为一旦解密被移除就无法再控制数据的传播,但一个可能的解决方案设想对多媒体作品进行数字水印处理,以便跟踪其传播。通过这种方式,允许的副本数量不受限制,但存在控制原始作品传播路径的可能性。

数字水印是一种携带有关版权所有者、作品创作者、授权消费者等信息的代码,以及处理与任何给定信息片段相关的财产权所需的任何信息。水印旨在永久嵌入到数字数据中,以便授权用户可以轻松读取它。同时,水印不应该显著修改作品的内容(它应该在统计上和感知上不可见或几乎不可见,以免降低数据质量并防止攻击者发现和删除它),并且对于未经授权的用户来说应该几乎不可能将其移除。通过水印处理,作品仍然可以访问,但被永久标记。为了真正有效,水印应该具备以下特点:

不显眼性:它应该在统计上和感知上不可见,以免降低数据质量并防止攻击者发现和删除它。

易于提取性:数据所有者或独立控制机构应该能够轻松提取它。

鲁棒性:对于试图伪造数据版权的攻击者来说,它必须难以(希望是不可能)被移除;如果只有水印的部分知识可用,试图移除或破坏它的尝试应该在水印丢失之前产生数据质量的显著降级。特别是,水印应该抵抗最常见的信号处理技术、多人共谋和伪造攻击,每个人都拥有文档的水印副本。

明确性:其检索应该明确地识别数据所有者。

可生成性:应该可能生成大量可相互区分的水印。

本文专注于图像水印算法;在这种特殊情况下,鲁棒性要求水印能够抵抗最常见的图像处理技术,如数字到模拟和模拟到数字转换、重采样、抖动、压缩、对比度或颜色增强,以及常见的几何失真,如旋转、平移、裁剪、缩放和行丢失。

到目前为止提出的图像水印技术可以分为两个主要组:那些直接在空间域中嵌入水印的技术和那些在变换域(例如频域)中操作的技术。技术也可以根据从可能失真的标记图像版本中提取水印的方式来区分。在某些情况下,通过将(失真的)标记图像与原始未标记图像进行比较来恢复水印,这样可以实现额外的鲁棒性程度,这实际上使得在不显著降级原始数据的情况下移除水印变得不可能。这种方法的例子在多个研究中有所报告,其中提出了几种方法,这些方法对各种图像处理技术和可能的攻击具有抵抗力,旨在移除水印或使其不可读。

不幸的是,要应用这些技术,必须保证能够访问原始图像,例如通过网络连接到数据库。这引发了双重问题,因为一方面水印系统的设置变得更加复杂,另一方面原始图像的所有者被迫与任何想要检查水印存在的人不安全地共享他们的作品。当然,能够在不比较标记图像和原始图像的情况下揭示标记存在的方法是更可取的。在后续内容中,不需要比较水印图像和非水印图像就能恢复水印的技术将被称为盲水印技术。

在本文中,提出了一种适合标记灰度图像的DCT域水印技术。在检测阶段无需访问未标记图像的需求被消除,从而相对于依赖水印图像和原始图像之间比较的方法实现了重大改进,尽管以轻微的鲁棒性损失为代价。然而,该算法仍然足够鲁棒,并且嵌入的标记在大多数实际应用中根据需要不可见,因此我们的提案可能代表朝着保护要通过开放网络环境传播的类图像数据的良好起点。

如同某些研究中一样,水印由伪随机序列组成,该序列叠加到全帧DCT变换的一些系数上。然而,与该方法不同的是,标记总是叠加到相同的系数集合上,从而避免了需要原始图像来确定伪随机序列隐藏位置的需要。通过这种方式,标记的恢复更加困难,因为原始DCT值是未知的。为了重新获得一些鲁棒性,引入了新的嵌入技术并使用了更长、更高能量的随机序列。这可能从标记可见性的角度引起一些问题,这些问题通过适当选择叠加标记的DCT值集合,以及通过在由高亮度方差特征的图像区域中感知上隐藏它来解决。

第二章 在频域中嵌入水印

为了完全定义在变换域中操作的水印技术,必须指定三个主要步骤:图像变换、水印嵌入和水印恢复。

关于图像变换,实际上所有迄今为止提出的技术都使用DCT,少数例外情况除外,如在DFT的相位中嵌入水印的研究,以及使用DCT、Walsh变换或小波变换的方法。根据不同的方法,变换可以应用于整个图像,如某些研究中所示,或者应用于其子部分(块),如其他研究中所述。为了将水印代码嵌入到图像中,选择变换域中的一些系数,这些系数将根据水印规则进行修改。要修改的系数可以涉及整个图像,或者只标记一些块。在第二种情况下,获得了混合技术,其中水印在频域中添加,但也通过仅标记图像块的子集来利用空间信息。

通常,水印叠加的系数集合属于频谱的中等范围,这样可以在感知不可见性和对压缩及其他常见图像处理技术的鲁棒性之间取得平衡;有两种技术与此事实形成直接对比,即水印被放置在信号的感知上重要的频谱分量中:第一种是将水印嵌入到DFT的相位中,这种方法对篡改相当鲁棒,与幅度相比具有优越的噪声抗扰性,第二种是将水印插入到1000个最大的DCT系数中,不包括DC项。

为了恢复水印,一些算法将原始图像与可能损坏和水印的图像进行比较,以提供对攻击的额外鲁棒性,因为通过比较原始系数与水印系数来检索水印;此外,使用原始图像允许在水印检查之前进行一些预处理;可以估计旋转角度、平移和比例因子,可以用原始图像的相应部分替换图像的缺失部分,如某些研究中所示。

在某些研究中,水印由1000个随机生成的具有零均值和单位方差的正态分布实数序列组成:$X = {x_1, x_2, ..., x_{1000}}$;计算整个图像的DCT,并选择1000个最大的DCT系数,不包括DC项;通过根据以下关系修改选定的DCT系数$T = {t_1, t_2, ..., t_{1000}}$来添加水印:

$t'_i = t_i + \alpha t_i x_i$

其中$i = 1, 2, ..., 1000,\alpha = 0.1$

给定原始图像I和可能失真的图像$I^*$,通过基本上逆转嵌入过程来提取可能损坏的水印$X^*$。在原始图像中选择具有最大幅度的n个DCT分量,并计算未标记系数与(损坏的)标记图像的系数之间的差异。通过这种方式,获得标记序列$X^*$的估计。然后通过以下公式测量X和$X^*$之间的相似性:

$\text{sim}(X, X^*) = \frac{X \cdot X^*}{\sqrt{X^* \cdot X^*}}$

其中$X \cdot X^*$表示向量X和$X^*$之间的标量积。该研究报告的实验结果非常有趣:该算法可以从通过几种常见几何失真和信号处理技术显著降级的图像中提取可靠的水印副本:缩放到图像大小的75%、质量因子为5%的JPEG压缩、抖动、削波,以及打印、复印、重新扫描和缩放的序列。通过在检测步骤中使用原始图像实现了对几何变形的鲁棒性。

有时,如在某些研究中,考虑人类视觉系统(HVS)的特性来使水印适应被签名的数据,以改善水印的不可见性并增强其鲁棒性(可以嵌入更大能量内容的水印)。

第三章 基础知识与原理详解

3.1 离散余弦变换(DCT)的数学基础

离散余弦变换(Discrete Cosine Transform,DCT)是数字信号处理和图像处理中一种极其重要的正交变换技术。DCT变换最早由K. R. Rao、N. Ahmed和T. Natarajan三位学者在1974年提出,它是一种与傅里叶变换密切相关的变换方法,但与传统的离散傅里叶变换(DFT)不同的是,DCT只使用实数进行运算,完全避免了复数计算的复杂性和存储需求。从数学本质上来看,DCT可以被理解为对一个长度大约是原序列两倍的实偶函数进行的离散傅里叶变换,这种独特的特性使得DCT在处理实值信号时具有天然的优势和计算效率。

DCT变换的核心思想是将信号从时域(或空间域)转换到频域表示,通过一组不同频率的余弦基函数的线性组合来完整表示原始信号。这种变换具有优良的能量压缩特性,即对于大多数自然信号(如语音信号、图像信号),其能量主要集中在DCT变换后的低频部分,而高频部分的系数通常很小且可以在一定程度上被舍弃而不显著影响信号质量。这一重要特性使得DCT成为数据压缩领域的理想选择,在JPEG图像压缩标准、MPEG视频压缩标准以及MP3音频压缩等国际标准中,DCT都扮演着不可替代的核心角色。

从严格的数学定义来看,一维DCT变换可以表达如下:对于长度为N的离散信号序列$f(x)$,其中$x = 0, 1, 2, ..., N-1$,其DCT变换系数为:

$F(u) = \alpha(u) \sum_{x=0}^{N-1} f(x) \cos\left[\frac{\pi(2x+1)u}{2N}\right]$

其中,$u = 0, 1, 2, ..., N-1$,而$\alpha(u)$是归一化系数,定义为:

相应的反DCT变换(IDCT)可以表示为:

$f(x) = \sum_{u=0}^{N-1} \alpha(u) F(u) \cos\left[\frac{\pi(2x+1)u}{2N}\right]$

这种正交变换的一个重要特性是其完美的可逆性,即通过DCT变换和反DCT变换可以完全无损地重构原始信号,这为其在各种应用中的可靠性提供了数学保证。

3.2 二维DCT变换与可分离性

在图像处理的实际应用中,我们主要关注二维DCT变换的性质和应用。由于DCT变换核函数具有重要的可分离性质,二维DCT可以通过两次连续的一维DCT变换来高效实现,这种可分离性不仅大大简化了算法的计算复杂度,也为硬件实现和并行处理提供了便利条件。对于一个$N \times N$的图像块$f(x,y)$,其二维DCT变换的完整数学定义为:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

智算菩萨

欢迎阅读最新融合AI编程内容

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值