14、分布式视频编码（DVC）算法：混合、可扩展与鲁棒方案解析

珊珊333333

于 2025-08-06 10:36:01 发布

阅读量85

点赞数

CC 4.0 BY-SA版权

分类专栏：分布式多描述编码：图像与视频传输的革新文章标签：分布式视频编码 DVC 混合DVC方案

本文链接：https://blog.youkuaiyun.com/css33/article/details/150008786

分布式多描述编码：图像与视频传输的革新专栏收录该内容

15 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

分布式视频编码（DVC）算法：混合、可扩展与鲁棒方案解析

1. 混合DVC方案

1.1 实验结果

在标准QCIF@15fps序列的亮度分量上进行了实验，比较了五种不同的DVC方案，包括提出的带帧内模式的HDVC、不带帧内模式的HDVC、纯SW - SPIHT DVC、残差DVC和DCT域DVC。

对比方案	Hall序列提升（dB）	Foreman序列提升（dB）
与纯SW - SPIHT结果对比	最高4.1	-
与残差DVC结果对比	最高3.2	-
与最新DCT域DVC结果对比	最高3	最高0.9

带帧内模式决策时，在高运动帧中质量提升明显，在高运动情况下PSNR提升最高可达2.1dB。与H.264/AVC的帧内编码相比，该方案PSNR最高可提升7dB，但与H.264/AVC的帧间编码仍有差距。

1.2 方案总结

提出了一种带帧内模式决策的高效混合DVC方案，以提高当前DVC的率失真性能。该方案结合了残差编码、SW - SPIHT编码和帧内模式决策策略，比纯SW - SPIHT、残差DVC和最新的DCT域DVC有更明显的改进。HDVC的编码主要包括SPIHT、帧内模式决策和LDPCA编码，避免了复杂的运动估计，保留了类似于帧内编码的低复杂度编码特性。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(SPIHT):::process --> B(帧内模式决策):::process
    B --> C(LDPCA编码):::process
    C --> D(混合DVC编码输出):::process

2. 基于块SW - SPIHT的可扩展DVC方案

2.1 动机

可扩展性在许多应用中很重要，现有的可扩展DVC方案存在一些问题，如基于分层编码，解码比特率受限，编码时采用不完全的帧内编码和运动补偿，对有损信道脆弱等。因此提出了一种无需分层编码的可扩展DVC方案，继承了DVC的易编码和鲁棒性，同时增加了可扩展性。

2.2 概述

考虑可扩展DVC，采用基于块SW - SPIHT的完整帧内编码模型对Wyner - Ziv帧进行编码。块SW - SPIHT具有嵌入式比特流，截断率比分层编码更灵活，完整帧内编码更具鲁棒性。还提出了在解码器使用带速率自适应“哈希”的二进制运动搜索（BMS）。

2.3 编码方案

2.3.1 方案框架

提出的可扩展DVC框架具有以下特点和优势：
1. 完整的帧内编码模型，由帧内SPIHT和信道编码组成，复杂度与传统帧内编码相似。
2. 编码器无运动搜索，解码器使用BMS，避免了传统帧间编码的预测偏移，比帧间编码更鲁棒。
3. 编码器的块SPIHT比特流可无损地在解码器接收，具有嵌入式比特流，可在SNR特性上实现可扩展性，也可轻松扩展到时间和空间可扩展性。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(生成WBs):::process --> B(块SPIHT编码):::process
    B --> C(SW编码):::process
    C --> D(AC编码):::process
    D --> E(传输):::process
    E --> F(AC解码):::process
    F --> G(SW解码):::process
    G --> H(块SPIHT解码):::process
    H --> I(DWT逆变换):::process
    I --> J(恢复帧):::process
    K(DWT LBS):::process --> L(BMS):::process
    L --> H

2.3.2 块SPIHT

对Wyner - Ziv帧进行三尺度DWT（可轻松扩展到更多尺度），将DWT系数划分为16×16的跨尺度小波块（WB）。每个WB由多个小波树组成，可方便地使用SPIHT，所有WB在块SPIHT中使用相同的原始阈值（整个DWT图像的最大值）。实验表明，块SPIHT与传统SPIHT对整个图像的性能几乎相同。

2.3.3 块SW - SPIHT

在编码器，对WB进行块SPIHT后，得到树分布信息SD、显著信息SP、符号信息SS和细化信息SR，SD通过算术编码发送到解码器。在解码器，使用接收到的SD对侧WB进行块SPIHT，得到SP0、SS0和SR0，然后通过无损Slepian - Wolf解码恢复主序列SP、SS和SR。

2.4 BMS与速率可变“哈希”

在解码器使用带速率可变“哈希”的BMS，“哈希”基于SD和SP的部分奇偶校验位。具体搜索步骤如下：
1. 对SP进行SW编码，并将其所有奇偶校验位存储在缓冲区。
2. 将SP的第一部分奇偶校验位发送到解码器，判断SP是否能从SP0₁正确解码。如果解码成功，使用对应的SS0₁、SR0₁解码SS和SR，否则i = i + 1，尝试下一个参考WB。
3. 如果在步骤2中使用较少奇偶校验位的所有参考WB都无法正确解码SP，则发送更多部分的奇偶校验位。
4. 重复步骤2和3，直到找到发送SP所需奇偶校验位最少的侧WB，并获取对应的SS0ₛ、SR0ₛ。

2.5 实验结果

对QCIF Carphone的前101帧和Foreman的361帧的亮度分量进行测试，帧速率为30Hz，偶数帧采用Wyner - Ziv模型编码，SW - 编解码器基于累积LDPC。实验包括：
1. H.263 +的帧间编码性能（I - B - I - B）。
2. 对偶数帧测试传统SPIHT和块SPIHT的效率。
3. 对奇数帧测试不带BMS的块SW - SPIHT的效率。
4. 展示带BMS的块SW - SPIHT的运动搜索效率。

实验结果表明，块SPIHT不影响SPIHT的性能，SW - SPIHT比SPIHT PSNR提升超过2dB，解码器的BMS为块SW - SPIHT带来超过1dB的提升，且保留了可扩展性。但对于Carphone序列，由于运动较少，运动搜索效果不佳。与Anne的像素域DVC相比，在高比特率下，该系统的PSNR更高，且实现了SNR可扩展性。不过，该方案在低比特率下SPNR较低，解码时计算量较大。

3. 基于零填充的鲁棒DVC方案

3.1 动机

在低功耗捕获的视频通过无线网络传输时，鲁棒的DVC方法尤为必要。DVC本身由于采用纠错信道解码算法而具有一定的固有鲁棒性，但这种鲁棒性是以牺牲压缩效率为代价的。DVC假设待编码源与其在解码器处可用的边信息之间存在相关信道，压缩效率取决于边信息的相关性，在高丢包率情况下，边信息的相关性降低，压缩效率受到极大限制。

一些相关的鲁棒性方案也存在问题，例如基于Wyner - Ziv编码的系统级有损错误保护（SLEP）方案，虽然具有两层可扩展性，但在MPEG编码器中仍应用了运动估计，不能保证低复杂度编码的特性，且MPEG编码流中的错误传播可能会对边信息的质量产生负面影响，降低系统的鲁棒性。分布式多描述编码（MDC）是一种有吸引力的鲁棒传输框架，它将源消息编码成多个携带不同但相关信息的比特流（描述），可以通过不同的信道传输，即使某些信道出现故障，丢失的描述也可以通过接收到的相关描述进行估计。因此，通过结合多描述编码来解决DVC的鲁棒性问题，设计一种在低复杂度编码约束下的鲁棒多描述DVC方案。

3.2 方案设计思路

为了实现鲁棒的DVC，将多描述编码与DVC相结合。具体来说，在DVC的基础上，采用零填充的方法来构建多描述编码。以下是该方案的主要设计要点：
- 零填充原理 ：在编码过程中，对视频数据进行零填充操作，将其扩展为多个描述。零填充可以增加数据的冗余性，使得在传输过程中即使部分数据丢失，也可以通过其他描述进行恢复。
- 多描述编码结构 ：将零填充后的数据进行编码，生成多个描述。这些描述可以通过不同的信道进行传输，提高传输的鲁棒性。

3.3 方案优势

与传统的DVC方案相比，基于零填充的鲁棒DVC方案具有以下优势：
| 优势 | 说明 |
| — | — |
| 鲁棒性增强 | 通过多描述编码，即使在高丢包率的情况下，也可以通过接收到的相关描述来恢复丢失的数据，提高了系统的鲁棒性。 |
| 低复杂度编码 | 该方案在编码过程中仍然保留了DVC的低复杂度编码特性，避免了复杂的运动估计等操作。 |
| 灵活性 | 可以根据实际需求调整零填充的参数和多描述的数量，以平衡鲁棒性和压缩效率。 |

3.4 可能面临的挑战和解决方案

在实际应用中，基于零填充的鲁棒DVC方案可能会面临一些挑战，以下是一些可能的挑战及相应的解决方案：
- 压缩效率降低 ：零填充会增加数据的冗余性，从而可能导致压缩效率降低。解决方案是优化零填充的参数，在保证鲁棒性的前提下，尽量减少冗余数据的产生。
- 解码复杂度增加 ：由于需要处理多个描述，解码复杂度可能会增加。可以通过优化解码算法，提高解码效率。
- 信道分配问题 ：如何合理地将多个描述分配到不同的信道上是一个关键问题。可以根据信道的质量和带宽等因素，采用自适应的信道分配策略。

4. 总结与展望

4.1 方案总结

本文介绍了三种不同的DVC方案，分别是混合DVC方案、基于块SW - SPIHT的可扩展DVC方案和基于零填充的鲁棒DVC方案。

方案名称	主要特点	优势	不足
混合DVC方案	结合残差编码、SW - SPIHT编码和帧内模式决策策略	提高率失真性能，避免复杂运动估计，保留低复杂度编码特性	与H.264/AVC的帧间编码仍有差距
可扩展DVC方案	基于块SW - SPIHT，采用带速率自适应“哈希”的二进制运动搜索	实现SNR可扩展性，比特流截断率灵活，具有鲁棒性	低比特率下SPNR较低，解码计算量较大
鲁棒DVC方案	结合多描述编码和零填充方法	增强鲁棒性，保留低复杂度编码特性	可能降低压缩效率，增加解码复杂度

4.2 未来展望

虽然这些方案在不同方面取得了一定的成果，但仍有许多工作有待进一步开展。例如：
- 可扩展DVC方案 ：Slepian - Wolf编码中的反馈机制在没有反馈信道时会使系统失效，未来可以研究相似性估计的方法来解决这个问题。同时，由于SPIHT对信道错误比较脆弱，可考虑采用多描述编码（MD）来保护SPIHT的比特流。
- 鲁棒DVC方案 ：需要进一步优化零填充的参数和多描述编码的结构，以提高压缩效率和解码效率。同时，研究更有效的信道分配策略，以适应不同的网络环境。

总体而言，分布式视频编码是一个具有广阔应用前景的领域，未来的研究将致力于提高编码效率、增强鲁棒性和实现更多的可扩展性，以满足不同应用场景的需求。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(混合DVC方案):::process --> B(可扩展DVC方案):::process
    B --> C(鲁棒DVC方案):::process
    C --> D(未来研究方向):::process
    D --> E(提高编码效率):::process
    D --> F(增强鲁棒性):::process
    D --> G(实现更多可扩展性):::process