基于模拟块的鲁棒视频水印技术-优快云博客

VW16E：一种基于模拟块的鲁棒视频水印技术

摘要

视频水印技术的基本思想是在视频宿主中隐藏信息，以实现认证和篡改检测等不同目的。在视频宿主中隐藏信息的最常见方法是空域方法。本文重点研究视频水印技术，特别是针对音频视频交错（AVI）格式的视频文件在空域中通过模拟块实现的水印技术。该文提出了一种新的水印技术，与其它类似方案相比，具有更高的不可感知性和高效的篡改检测能力。

关键词 水印 ⋅ Tamper检测 ⋅ Block simulation ⋅ Robustness

1 引言

数字水印是一种嵌入在宿主媒介（如数字图像、音频、文本、软件或视频）中的标识，通常用于所有权保护。水印技术是将数字信息隐藏于载体信号（宿主）中的方法。所隐藏的数据不一定与宿主内容相关 [1]。特别是对于视频文件，为了应对非法篡改和不诚实分发问题，应用了视频水印技术 [2]。

数字视频在法庭中作为法庭证据发挥着重要作用[3]。因此，视频文件应具备可认证性，并能够检测篡改，为此应用了诸如水印之类的技术。水印不得对视觉信息产生任何影响，也不得降低视频证据的可信度。因此，高不可感知性的水印已对此做出了响应。

提及的必要性 [4–7]。视频篡改检测是当今研究人员在多媒体安全领域面临的挑战 [8, 9]。尽管视频水印具有多种特性，但主要的三个特性是不可感知性、鲁棒性和有效载荷或容量，它们之间密切相关，例如当鲁棒性增加时，不可感知性会降低，反之亦然[10, 11]。对于任何应用和相关技术，都应找到这些相互冲突要求之间的正确平衡[10, 12]。

如今，许多场合都已安装了摄像头，甚至在街道上也安装了用于监控斗殴、毒品交易和其他不当行为的摄像头。警方可以实时看到犯罪过程，或利用视频协助后续调查。数字多媒体内容可以轻松复制和存储，且不会损失保真度。在数字视频系统（DVS）中，视频文件至关重要，因为它可作为证据使用；然而，市面上有许多视频编辑软件可以轻易地对视频文件进行篡改，操作简单、成本低廉 [13]。

随着通信网络的发展，由于数字产品易于转换和复制的特性，数字篡改检测已成为亟待解决的关键问题。与数字图像相比，用于视频水印篡改检测的技术发展较为滞后[10]。由于视频帧之间存在天然冗余性，因此适用于图像篡改检测的技术并不适用于数字视频水印，尤其无法应对帧丢弃、帧插入、帧移位等攻击。此外，现有技术在检测篡改区域方面的能力也受到限制[14]。

篡改检测技术必须设计用于确保视频内容验证和防止伪造。研究人员已提出数字水印以验证数字视频的内容完整性[15–18]。在任何领域中的大量修改均可用于水印技术[19]。另一方面，视频市场正变得越来越流行；摄像头信息结果在环境和人员安全中起着重要作用。为了不改变视觉信息的概念，嵌入的数据应具有不可感知性和鲁棒性。因此，除了鲁棒性和不可感知性外，视频水印还受到计算量的约束[20]。

视频应用需要处理大量的序列。水印技术也可以应用于频域。这些技术能够获得更高的不可感知性以及更好的鲁棒性。频域方法的缺点是与空域方法相比计算量较大。空域技术比其他水印领域更适合视频水印。水印也可以嵌入到频域 [21] 中。在变换域中，首先将宿主转换到频域，然后添加水印，再进行逆频域变换。其中一种常见的变换方法是离散余弦变换（DCT），它将图像划分为低、中、高频带。从不可感知性的角度来看，中频带是最优的选择该频带而非另外两个频带。如果将水印嵌入高频子带，边缘细节和其他信息会受到影响[22–24]。另一方面，当水印嵌入低频子带时，不可感知性会受到负面影响。离散余弦变换在透明性方面不如空域方法高效，且其计算量相对较大[11]。另一种常见的变换方法是离散小波变换，它将图像分解为四个子带：低分辨率近似子带（LL）、水平细节子带（HL）、垂直细节子带（LH）和对角线细节子带（HH）。边缘和纹理模式位于高分辨率子带中。

不能在LL子带中嵌入水印，因为图像的平滑部分位于此区域；也不能在 HH子带中嵌入水印，否则会导致图像的主要细节丢失。因此，通常选择 HL和LH子带进行水印嵌入[21]。离散小波变换在透明性方面也不如空域方法高效，且相比离散余弦变换具有更高的计算量[25]。

在视频宿主中隐藏信息最常用的方法是空域技术。空域技术的鲁棒性不如其他技术高。为了提高空域技术的鲁棒性，可以多次重复嵌入水印。因此，如果在遭受攻击后仍有单个水印副本得以保留，则该水印可以被提取出来，从而通过鲁棒性测试。此外，尽管空域技术易于实现，但有时添加的噪声会完全破坏水印，并且攻击者通过将预期样本与接收到的信号[10, 26,27]进行比较可能察觉到这一点。

为了使空域技术与其他技术一样高效，需要更多的有效载荷来嵌入附加信息。这些附加信息将包括冗余水印以确保可实现的鲁棒性，以及更多像素的元数据以确保可实现的效率来检测更多攻击。所有这些所需的附加信息都会降低质量（不可感知性）[9]。

本文提出了VW16E技术，并讨论了该技术的设计与实现。该技术在空域中实现。在AVI视频文件格式中，每个像素由2字节表示。采用分块技术来确定具体被修改的块。

2 块模拟

每个 2 × 2块的模拟由视频流中四个连续的像素组成，如图 1 所示。在模拟过程中，读取前两个像素后，无需跳转到下一行来读取最后两个像素。在块模拟中，视频数据被视为连贯的数据，视频帧不会对构建块造成限制。一个块可以由两个不同帧的像素构成，例如前三个像素来自一个块的末尾，最后一个像素来自下一帧。该技术能够水印更多的像素（几乎全部像素）

而不是常见的创建真实 2 × 2块并排除块周围边界处未包含像素的技术。

每个块中第一个像素的地址代表该’块的地址。所提出的 2 × 2技术将视频流分割为不重叠的模拟块。因此，如图 2 所示，块的每个单元中有 2 个字节。

所提出的水印即VW16E技术，具有16位。该水印被替换为每个像素的 4个最低有效位（LSB）。该水印由完整性位和保密位组合而成。水印包含 12位完整性位和4位保密位。完整性位中包含4位块地址和8位像素数据。这 16位水印是每个大小为 2 × 2像素的模拟块的签名。

示意图0

示意图1

图 3显示，所有像素均参与创建16位水印。每个像素中的两个最高有效位用于完整性信息。至此，已生成16位中的8位。如图4所示，该块的地址以4字节表示，并在

水印仅使用4位。因此，引入了16位中的12位。剩余的16位水印中的4位保留用于保密位。

完整性和机密位被共同设置并形成16位水印。如图5所示，所有机密位均位于最低有效位的第一层。该技术在最低有效位的末层嵌入16位水印信息，其中机密位位于最低有效位的末层，称为末端视频水印16，简称“ VW16E”。

示意图2

示意图3

示意图4

图 6显示了编写VW16E的软件代码部分。首先，与一个块相关的四个像素被标红并展开。然后按提及的顺序替换完整性数据。至此，已写入8位水印。在此程序中，消息大小被存储，将在提取时使用。为了写入剩余的四位水印，在 “if” 中，首先检查消息大小的值是否完成，将开始写入机密数据。

示意图5

3 测试不可感知性

本节详细展示了该技术的实现结果。为了测试该技术的不可感知性，共选取了14个以AVIfile格式录制的视频样本进行测试。各实验视频序列的参数如表1所示。这些视频根据不同的时长和不同的总帧数进行选择。另一方面，对于机密位，选用了四种不同大小的文本file。消息参数如表2所示。

为了提高空域水印技术的鲁棒性，可以多次嵌入一个小水印。因此，只要有一个水印副本得以保留，该方法即通过鲁棒性测试。因此，所有作为保密位与完整性位一起嵌入的机密消息均为同一个RSA密钥的重复。本研究中将保密位称为消息。消息编号1为一个RSA密钥，消息编号2为18个相同的RSA密钥，消息编号3为212个相同的RSA密钥，消息编号4为同一RSA密钥重复1182次。

本节介绍了在所有视频样本中使用VW16E技术嵌入四条消息的实验结果。另一方面，计算了每个原始视频与嵌入消息后的视频之间的峰值信噪比（PSNR）。

3.1 视频样本1的VW16E技术测试结果

本节展示了将四条消息嵌入视频样本1的结果。这些消息的大小各不相同。
M1的大小为1,669字节，M2的大小为30,044字节，M3的大小为353,828字节，M4的大小为1,972,764字节，而视频样本1的大小为16,080,844字节。

在样本1中可用于机密消息的最大可用比特数为5,356,800位。

由于M4中的位数超过了样本1中为机密消息预留的预留比特数量，因此 M4不适合在第一个视频样本中通过VW16E技术进行替换；因此，最后一条消息没有结果。其余三条消息均被嵌入，并计算了PSNR，该值表示原始视频宿主与水印视频之间的一致性。表3显示了PSNR值的结果。如预期所示，图7的结果表明，随着消息大小的增加，PSNR值下降。

视频样本编号	大小(字节)	长度(秒)	帧宽度(像素)	帧高度(像素)	帧率(帧/秒)	总帧数	总像素	完整性位(VW16E)
1	16,080,844	0.00.03	320	180	29	93	5,356,800	16,070,400
2	29,272,060	0.00.04	320	240	29	127	5,356,800	16,070,400
3	39,239,260	0.00.07	320	180	29	227	9,753,600	29,260,800
4	57,212,956	0.00.11	320	180	29	331	13,075,200	39,225,600
5	68,964,988	0.00.13	320	180	29	399	13,075,200	39,225,600
6	78,813,220	0.00.11	320	240	29	342	19,065,600	57,196,800
7	125,128,444	0.00.18	320	240	29	543	22,982,400	68,947,200
8	129,042,292	0.00.14	320	320	29	420	26,265,600	78,796,800
9	243,690,052	0.00.47	320	180	29	1410	26,265,600	78,796,800
10	245,936,764	0.00.47	320	180	29	1423	26,265,600	78,796,800
11	259,417,036	0.00.50	320	180	29	1501	26,265,600	78,796,800
12	260,626,804	0.00.50	320	180	29	1508	26,265,600	78,796,800
13	296,064,676	0.00.53	320	192	29	1606	26,265,600	78,796,800
14	391,159,132	0.00.51	320	262	29	1555	26,265,600	78,796,800

名称	文件类型	大小（字节）	机密比特
M1	TXT	1,669	13,352
M2	TXT	30,044	240,352
M3	TXT	353,828	2,830,624
M4	TXT	1,972,764	15,782,112

宿主	宿主大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本1	16,080,844	M1	13,352	16,070,400	34.971
视频样本1	16,080,844	M2	240,352	16,070,400	34.965
视频样本1	16,080,844	M3	2,830,624	16,070,400	34.902
视频样本1	16,080,844	M4	15,782,112	16,070,400	M4 too big

示意图6

3.2 VW16E技术对视频样本2的测试结果

本节展示了将四条消息嵌入到大小为29,272,060字节的视频样本2中的结果。
另一方面，M1的大小为1,669字节，M2的大小为30,044字节，M3的大小为 353,828字节，M4的大小为1,972,764字节。在样本2中可用于嵌入机密消息的最大可用比特数为9,753,600。尽管M4的大小小于样本2的大小，但使用 VW16E技术时M4并不合适，因为M4内部的比特数超过了预留的比特数。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本2	29,272,060	M1	13,352	29,260,800	34.757
视频样本2	29,272,060	M2	240,352	29,260,800	34.754
视频样本2	29,272,060	M3	2,830,624	29,260,800	34.734
视频样本2	29,272,060	M4	15,782,112	29,260,800	M4 也 big

示意图7

3.3 VW16E技术对视频样本3的测试结果

本部分展示了将四条消息嵌入视频样本3的结果。按顺序嵌入到视频样本3中的四条消息的大小分别为1,669字节、30,044字节、353,828字节和 1,972,764字节。第三个视频流的容量为39,239,260字节。每条消息均被嵌入，并计算了PSNR，该值表示原始视频宿主与水印视频之间的保真度。图 9描绘了PSNR的变化趋势：消息尺寸增大，PSNR值降低。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本3	39,239,260	M1	13,352	39,225,600	34.771
视频样本3	39,239,260	M2	240,352	39,225,600	34.769
视频样本3	39,239,260	M3	2,830,624	39,225,600	34.753
视频样本3	39,239,260	M4	15,782,112	39,225,600	34.667

示意图8

3.4 VW16E技术对视频样本4的测试结果

本节展示了将四条消息嵌入视频样本4的结果。消息的大小各不相同。M1的大小为1,669字节，M2的大小为30,044字节，M3的大小为353,828字节， M4的大小为1,972,764字节，而视频样本4的大小为57,212,956字节。每条消息均被嵌入，并计算了PSNR，该值表示原始视频宿主与水印视频之间的保真度。表6给出了PSNR值的计算结果。图10显示的曲线符合预期趋势。

宿主	宿主大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本4	57,212,956	M1	13,352	57,196,800	34.864
视频样本4	57,212,956	M2	240,352	57,196,800	34.863
视频样本4	57,212,956	M3	2,830,624	57,196,800	34.852
视频样本4	57,212,956	M4	15,782,112	57,196,800	34.795

示意图9

3.5 VW16E技术对视频样本5的测试结果

在本节中，展示了将四条消息嵌入到大小为 68,964,988 字节的视频样本5中的结果。另一方面，该尺寸
M1的大小为1,669字节，M2的大小为30,044字节，M3的大小为353,828字节， M4的大小为1,972,764字节。表7展示了峰值信噪比，用于计算原始视频宿主与水印视频之间的保真度。当消息大小减小时，PSNR随之增加，如图11所示。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本5	68,964,988	M1	13,352	68,947,200	35.001
视频样本5	68,964,988	M2	240,352	68,947,200	35.000
视频样本5	68,964,988	M3	2,830,624	68,947,200	34.992
视频样本5	68,964,988	M4	15,782,112	68,947,200	34.940

示意图10

3.6 VW16E技术对视频样本6的测试结果

本部分展示了将四条消息嵌入视频样本6的结果。按顺序嵌入到视频样本6中的四条消息的大小分别为1,669字节、30,044字节、353,828 字节和 1,972,764 字节。第六个视频流的容量为78,813,220 字节。表8显示了每条消息成功嵌入的结果，并计算了PSNR，该值表示原始视频宿主与水印视频之间的保真度。图12描绘了PSNR的变化趋势；其符合预期趋势，即随着消息大小的增加，PSNR值逐渐下降。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本6	78,813,220	M1	13,352	78,796,800	34.784
视频样本6	78,813,220	M2	240,352	78,796,800	34.784
视频样本6	78,813,220	M3	2,830,624	78,796,800	34.776
视频样本6	78,813,220	M4	15,782,112	78,796,800	34.735

示意图11

3.7 VW16E技术对视频样本7的测试结果

在本节中，展示了使用VW16E技术将四条消息嵌入到大小为125,128,444字节的视频样本7中的结果。
M1 的大小为 1,669 字节，M2 的大小为 30,044字节，M3 的大小为 353,828 字节，M4 的大小为 1,972,764 字节。此外，表9列出了峰值信噪比，用于表示原始视频宿主与水印视频之间的保真度，其值已计算得出。如图13所示，随着消息大小的增加，峰值信噪比下降。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本7	125,128,444	M1	13,352	125,107,200	34.917
视频样本7	125,128,444	M2	240,352	125,107,200	34.917
视频样本7	125,128,444	M3	2,830,624	125,107,200	34.912
视频样本7	125,128,444	M4	15,782,112	125,107,200	34.886

示意图12

3.8 VW16E技术对视频样本8的测试结果

本节展示了将四条消息嵌入到视频样本8的结果。这些消息的大小各不相同。
M1的大小为1,669字节，M2的大小为30,044字节，M3的大小为353,828字节， M4的大小为1,972,764字节，而视频样本8的大小为129,042,292字节。每条消息均被嵌入，并计算了PSNR值，该值表示原始视频宿主与水印视频之间的一致性。表10显示了PSNR值的结果，图14表明该图形符合预期趋势。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本8	129,042,292	M1	13,352	129,024,000	34.926
视频样本8	129,042,292	M2	240,352	129,024,000	34.924
视频样本8	129,042,292	M3	2,830,624	129,024,000	34.909
视频样本8	129,042,292	M4	15,782,112	129,024,000	34.840

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本9	243,690,052	M1	13,352	243,648,000	34.702
视频样本9	243,690,052	M2	240,352	243,648,000	34.701
视频样本9	243,690,052	M3	2,830,624	243,648,000	34.700
视频样本9	243,690,052	M4	15,782,112	243,648,000	34.688

3.10 VW16E技术对视频样本10的测试结果

本节展示了将四条不同大小的消息嵌入到视频样本10中的结果。M1的大小为 1,669字节，M2 为 30,044字节，M3 的大小为 353,828 字节，M4 的大小为 1,972,764 字节，而视频样本10 的大小为 245,936,764 字节。这四个消息均被嵌入，并计算了代表原始视频宿主与水印视频之间保真度的 PSNR。表12显示了 PSNR值的结果。如图 16所示，PSNR 呈现出预期的趋势。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本10	245,936,764	M1	13,352	245,894,400	34.881
视频样本10	245,936,764	M2	240,352	245,894,400	34.880
视频样本10	245,936,764	M3	2,830,624	245,894,400	34.870
视频样本10	245,936,764	M4	15,782,112	245,894,400	34.831

3.11 VW16E技术对视频样本11的测试结果

将四条消息嵌入到视频样本11中的结果在本部分中给出。按顺序嵌入到视频样本11中的四条消息的大小分别为1,669字节、30,044字节、353,828字节和 1,972,764字节。第11个视频流的容量为259,417,036字节。每条消息均被嵌入，并计算了表示原始视频宿主与水印视频的峰值信噪比已计算并显示在表13中。图 17描述了峰值信噪比的趋势；随着消息大小的增加，峰值信噪比下降。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本11	259,417,036	M1	13,352	259,372,800	35.010
视频样本11	259,417,036	M2	240,352	259,372,800	35.010
视频样本11	259,417,036	M3	2,830,624	259,372,800	35.007
视频样本11	259,417,036	M4	15,782,112	259,372,800	34.991

3.12 VW16E技术对视频样本12的测试结果

本节展示了将四条消息嵌入到视频样本12中的结果。消息的大小各不相同。
M1的大小为1,669字节，M2的大小为30,044字节，M3的大小为353,828字节， M4的大小为1,972,764字节，而视频样本12的大小为260,626,804字节。每条消息均被嵌入，并计算了表示原始视频宿主与水印视频之间保真度的PSNR值。表 14展示了PSNR值的结果。如图18所示，随着消息大小的增长，PSNR值下降。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本12	260,626,804	M1	13,352	260,582,400	34.720
视频样本12	260,626,804	M2	240,352	260,582,400	34.719
视频样本12	260,626,804	M3	2,830,624	260,582,400	34.717
视频样本12	260,626,804	M4	15,782,112	260,582,400	34.705

3.13 VW16E技术对视频样本13的测试结果

在本节中，展示了将四条消息嵌入到大小为296,064,676字节的视频样本13 中的结果。另一方面，M1的大小为1,669字节，M2的大小为30,044字节， M3的大小为353,828字节，M4的大小为1,972,764字节。表15列出了峰值信噪比，用于计算原始视频宿主与水印视频之间的保真度。图19显示，随着消息大小的增加，峰值信噪比下降。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本13	296,064,676	M1	13,352	296,017,920	34.788
视频样本13	296,064,676	M2	240,352	296,017,920	34.788
视频样本13	296,064,676	M3	2,830,624	296,017,920	34.785
视频样本13	296,064,676	M4	15,782,112	296,017,920	34.770

3.14 VW16E技术对视频样本14的测试结果

本部分展示了将四条消息嵌入视频样本14的结果。按顺序嵌入视频样本14的四条消息的大小分别为1,669字节、30,044字节、353,828字节和1,972,764字节。第14个视频流的容量为391,159,132字节。这四条消息被嵌入，且计算了峰值信噪比，该指标表示原始视频宿主与水印视频之间的保真度。图20峰值信噪比遵循预期趋势。

宿主	主机大小（字节）	机密消息	机密Bit	完整性位用于VW16E	PSNR
视频样本14	391,159,132	M1	13,352	391,113,600	34.989
视频样本14	391,159,132	M2	240,352	391,113,600	34.989
视频样本14	391,159,132	M3	2,830,624	391,113,600	34.986
视频样本14	391,159,132	M4	15,782,112	391,113,600	34.973

4 测试与评估的讨论与分析

提出了一种新的空间方案用于篡改检测，以提高篡改检测的不可感知性和效率。VW16E技术能够将机密性和完整性信息完美地嵌入到宿主视频中，同时提高了篡改检测的效率，但PSNR并未显著提升。此阶段的平均PSNR为 34.84分贝。在本节中，讨论了测试结果，并对所提技术的效率进行了测试。

此处水印仅指机密消息。

在本部分中，对采用VW16E技术嵌入水印的一个水印视频流应用了九种攻击，并对其结果进行了分析。在本节中，对嵌入水印后的视频流施加了一些攻击，包括帧插入、帧交换、帧删除、裁剪、旋转、反向旋转、帧移位、椒盐噪声和叠加攻击。接下来的步骤是对受攻击的视频进行篡改检测。为了本次测试和评估，我们选择了那些使用最大消息量技术嵌入水印的视频。这是因为视频的大部分区域都包含有效载荷，且显然整个视频都具有用于篡改检测的完整性位。

样本编号	攻击	第一个被篡改像素的地址 (十六进制)	是否检测到篡改	是否提取出水印	NC (%)	密钥可用性	效果
1	帧交换	3239AB	是	是	0.9999	是	20 和 93 交换
2	帧插入	4C97FB	是	是	0.9999	是	93 复制并插入到 30–50 之前
3	帧删除	B6113B	是	是	0.9999	是	第70帧被删除
4	裁剪	6081B	是	否	NA	NA	左右各裁剪40像素
5	旋转	2013	是	否	NA	NA	10°
6	反向旋转	2013	是	否	NA	NA	10°
7	帧移位	55CFB	是	是	0.8085	是	左移1帧
8	椒盐噪声	17F6BB	是	是	0.9999	是	第10–12帧应用
9	前景叠加	1828B	是	是	0.9576	是	第1–5帧叠加

4.1 对视频样本1的攻击

使用VW16E技术将第二条消息嵌入到样本1中。在宿主上应用了九种前述攻击。这九种攻击分别为帧插入、帧交换、帧删除、裁剪、旋转、反向旋转、移位、椒盐噪声和叠加攻击。这些攻击应用于嵌入水印后的视频流，随后分析受攻击的视频以判断其是否被篡改。表17显示了各种攻击下的篡改检测结果。如果能够提取出水印，则计算所提取水印的归一化系数（NC），并且如第二节所述，所使用的消息是密钥的重复。根据表17，在评估鲁棒性时，只要能成功恢复出一个完整的密钥即视为有效。

4.1.1 视频样本1上的裁剪攻击

对大小为16,080,844字节、包含30,044字节消息的样本1的所有帧，从上下左右各裁剪了四十（40）个像素。结果显示检测到修改，并返回地址 6081B作为第一个被篡改的块。图21 显示了嵌入水印后的帧，而同一帧的篡改检测结果如图22所示。

4.1.2 视频样本1上的帧删除攻击

样本1中第70帧已被删除，样本大小为16,080,844字节，消息为30,044字节。结果显示检测到修改，并返回地址B6113B作为被篡改的第一个块。第71帧的篡改检测结果如图 23所示。提取的水印NC为99.98%。

4.1.3 视频样本1的帧交换攻击

样本1中第20帧替换为第93帧，文件大小为16,080,844字节，消息大小为 30,044字节。结果表明修改被检测到，并返回地址3239AB作为被篡改的第一个块。提取出的水印的归一化系数为 99.98%。

4.1.4 视频样本1上的帧插入攻击

在宿主编号一（大小为16,080,844字节，包含30,044字节的消息）中，第 93帧被复制。结果显示检测到修改，并返回地址4C97FB作为被篡改的第一个块。提取出的水印的NC为99.98%。

4.1.5 视频样本1上的旋转攻击

样本1的所有帧，大小为16,080,844字节，并包含30,044字节的消息，已被旋转10°。结果显示检测到修改，地址2013被返回为第一个被篡改的块。图 24显示了嵌入的帧。

4.1.6 反向旋转攻击视频样本1

样本1的所有帧，大小为16,080,844字节，并包含30,044字节的消息，均被旋转了10°，然后被反转。结果显示未检测到修改。如图25所示为嵌入水印的帧，图26显示了被篡改的帧。

4.1.7 视频样本1上的椒盐攻击

对于第10、11和12帧，在大小为16,080,844字节且包含30,044字节消息的样本1上添加了椒盐噪声。结果显示检测到修改，并返回地址17F6BB作为第一个被篡改的块。图27显示了同一帧的篡改检测结果。提取水印的归一化相关值为99.98%。

4.1.8 视频样本1的帧移位攻击

样本1进行左移一帧，大小为16,080,844字节，并包含30,044字节的消息。结果显示检测到修改，返回地址55CFB作为被篡改的第一个块。提取水印的归一化相关值为80.85%。

4.1.9 视频样本1的叠加攻击

对于样本1中大小为16,080,844字节且包含30,044字节消息的帧编号1、2、3、4和5，已应用叠加。结果表明检测到修改，并返回地址1828B作为被篡改的第一个块。提取水印的归一化系数为95.76%。

5 结论

为认证和篡改检测等不同目的在视频宿主中隐藏信息是视频水印技术的基本思想。空域技术是用于在视频宿主中隐藏信息的最常见方法。我们专注于视频水印；特别是针对空域中的音频视频交错（AVI）格式的视频文件格式，通过模拟块实现。我们提出了一种新的水印技术，与其它类似方案相比，具有更高的不可感知性和高效的篡改检测能力。