14、分布式视频编码(DVC)算法:混合、可扩展与鲁棒方案解析

分布式视频编码(DVC)算法:混合、可扩展与鲁棒方案解析

1. 混合DVC方案

1.1 实验结果

在标准QCIF@15fps序列的亮度分量上进行了实验,比较了五种不同的DVC方案,包括提出的带帧内模式的HDVC、不带帧内模式的HDVC、纯SW - SPIHT DVC、残差DVC和DCT域DVC。

对比方案 Hall序列提升(dB) Foreman序列提升(dB)
与纯SW - SPIHT结果对比 最高4.1 -
与残差DVC结果对比 最高3.2 -
与最新DCT域DVC结果对比 最高3 最高0.9

带帧内模式决策时,在高运动帧中质量提升明显,在高运动情况下PSNR提升最高可达2.1dB。与H.264/AVC的帧内编码相比,该方案PSNR最高可提升7dB,但与H.264/AVC的帧间编码仍有差距。

1.2 方案总结

提出了一种带帧内模式决策的高效混合DVC方案,以提高当前DVC的率失真性能。该方案结合了残差编码、SW - SPIHT编码和帧内模式决策策略,比纯SW - SPIHT、残差DVC和最新的DCT域DVC有更明显的改进。HDVC的编码主要包括SPIHT、帧内模式决策和LDPCA编码,避免了复杂的运动估计,保留了类似于帧内编码的低复杂度编码特性。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(SPIHT):::process --> B(帧内模式决策):::process
    B --> C(LDPCA编码):::process
    C --> D(混合DVC编码输出):::process

2. 基于块SW - SPIHT的可扩展DVC方案

2.1 动机

可扩展性在许多应用中很重要,现有的可扩展DVC方案存在一些问题,如基于分层编码,解码比特率受限,编码时采用不完全的帧内编码和运动补偿,对有损信道脆弱等。因此提出了一种无需分层编码的可扩展DVC方案,继承了DVC的易编码和鲁棒性,同时增加了可扩展性。

2.2 概述

考虑可扩展DVC,采用基于块SW - SPIHT的完整帧内编码模型对Wyner - Ziv帧进行编码。块SW - SPIHT具有嵌入式比特流,截断率比分层编码更灵活,完整帧内编码更具鲁棒性。还提出了在解码器使用带速率自适应“哈希”的二进制运动搜索(BMS)。

2.3 编码方案

2.3.1 方案框架

提出的可扩展DVC框架具有以下特点和优势:
1. 完整的帧内编码模型,由帧内SPIHT和信道编码组成,复杂度与传统帧内编码相似。
2. 编码器无运动搜索,解码器使用BMS,避免了传统帧间编码的预测偏移,比帧间编码更鲁棒。
3. 编码器的块SPIHT比特流可无损地在解码器接收,具有嵌入式比特流,可在SNR特性上实现可扩展性,也可轻松扩展到时间和空间可扩展性。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(生成WBs):::process --> B(块SPIHT编码):::process
    B --> C(SW编码):::process
    C --> D(AC编码):::process
    D --> E(传输):::process
    E --> F(AC解码):::process
    F --> G(SW解码):::process
    G --> H(块SPIHT解码):::process
    H --> I(DWT逆变换):::process
    I --> J(恢复帧):::process
    K(DWT LBS):::process --> L(BMS):::process
    L --> H
2.3.2 块SPIHT

对Wyner - Ziv帧进行三尺度DWT(可轻松扩展到更多尺度),将DWT系数划分为16×16的跨尺度小波块(WB)。每个WB由多个小波树组成,可方便地使用SPIHT,所有WB在块SPIHT中使用相同的原始阈值(整个DWT图像的最大值)。实验表明,块SPIHT与传统SPIHT对整个图像的性能几乎相同。

2.3.3 块SW - SPIHT

在编码器,对WB进行块SPIHT后,得到树分布信息SD、显著信息SP、符号信息SS和细化信息SR,SD通过算术编码发送到解码器。在解码器,使用接收到的SD对侧WB进行块SPIHT,得到SP0、SS0和SR0,然后通过无损Slepian - Wolf解码恢复主序列SP、SS和SR。

2.4 BMS与速率可变“哈希”

在解码器使用带速率可变“哈希”的BMS,“哈希”基于SD和SP的部分奇偶校验位。具体搜索步骤如下:
1. 对SP进行SW编码,并将其所有奇偶校验位存储在缓冲区。
2. 将SP的第一部分奇偶校验位发送到解码器,判断SP是否能从SP0₁正确解码。如果解码成功,使用对应的SS0₁、SR0₁解码SS和SR,否则i = i + 1,尝试下一个参考WB。
3. 如果在步骤2中使用较少奇偶校验位的所有参考WB都无法正确解码SP,则发送更多部分的奇偶校验位。
4. 重复步骤2和3,直到找到发送SP所需奇偶校验位最少的侧WB,并获取对应的SS0ₛ、SR0ₛ。

2.5 实验结果

对QCIF Carphone的前101帧和Foreman的361帧的亮度分量进行测试,帧速率为30Hz,偶数帧采用Wyner - Ziv模型编码,SW - 编解码器基于累积LDPC。实验包括:
1. H.263 +的帧间编码性能(I - B - I - B)。
2. 对偶数帧测试传统SPIHT和块SPIHT的效率。
3. 对奇数帧测试不带BMS的块SW - SPIHT的效率。
4. 展示带BMS的块SW - SPIHT的运动搜索效率。

实验结果表明,块SPIHT不影响SPIHT的性能,SW - SPIHT比SPIHT PSNR提升超过2dB,解码器的BMS为块SW - SPIHT带来超过1dB的提升,且保留了可扩展性。但对于Carphone序列,由于运动较少,运动搜索效果不佳。与Anne的像素域DVC相比,在高比特率下,该系统的PSNR更高,且实现了SNR可扩展性。不过,该方案在低比特率下SPNR较低,解码时计算量较大。

3. 基于零填充的鲁棒DVC方案

3.1 动机

在低功耗捕获的视频通过无线网络传输时,鲁棒的DVC方法尤为必要。DVC本身由于采用纠错信道解码算法而具有一定的固有鲁棒性,但这种鲁棒性是以牺牲压缩效率为代价的。DVC假设待编码源与其在解码器处可用的边信息之间存在相关信道,压缩效率取决于边信息的相关性,在高丢包率情况下,边信息的相关性降低,压缩效率受到极大限制。

一些相关的鲁棒性方案也存在问题,例如基于Wyner - Ziv编码的系统级有损错误保护(SLEP)方案,虽然具有两层可扩展性,但在MPEG编码器中仍应用了运动估计,不能保证低复杂度编码的特性,且MPEG编码流中的错误传播可能会对边信息的质量产生负面影响,降低系统的鲁棒性。分布式多描述编码(MDC)是一种有吸引力的鲁棒传输框架,它将源消息编码成多个携带不同但相关信息的比特流(描述),可以通过不同的信道传输,即使某些信道出现故障,丢失的描述也可以通过接收到的相关描述进行估计。因此,通过结合多描述编码来解决DVC的鲁棒性问题,设计一种在低复杂度编码约束下的鲁棒多描述DVC方案。

3.2 方案设计思路

为了实现鲁棒的DVC,将多描述编码与DVC相结合。具体来说,在DVC的基础上,采用零填充的方法来构建多描述编码。以下是该方案的主要设计要点:
- 零填充原理 :在编码过程中,对视频数据进行零填充操作,将其扩展为多个描述。零填充可以增加数据的冗余性,使得在传输过程中即使部分数据丢失,也可以通过其他描述进行恢复。
- 多描述编码结构 :将零填充后的数据进行编码,生成多个描述。这些描述可以通过不同的信道进行传输,提高传输的鲁棒性。

3.3 方案优势

与传统的DVC方案相比,基于零填充的鲁棒DVC方案具有以下优势:
| 优势 | 说明 |
| — | — |
| 鲁棒性增强 | 通过多描述编码,即使在高丢包率的情况下,也可以通过接收到的相关描述来恢复丢失的数据,提高了系统的鲁棒性。 |
| 低复杂度编码 | 该方案在编码过程中仍然保留了DVC的低复杂度编码特性,避免了复杂的运动估计等操作。 |
| 灵活性 | 可以根据实际需求调整零填充的参数和多描述的数量,以平衡鲁棒性和压缩效率。 |

3.4 可能面临的挑战和解决方案

在实际应用中,基于零填充的鲁棒DVC方案可能会面临一些挑战,以下是一些可能的挑战及相应的解决方案:
- 压缩效率降低 :零填充会增加数据的冗余性,从而可能导致压缩效率降低。解决方案是优化零填充的参数,在保证鲁棒性的前提下,尽量减少冗余数据的产生。
- 解码复杂度增加 :由于需要处理多个描述,解码复杂度可能会增加。可以通过优化解码算法,提高解码效率。
- 信道分配问题 :如何合理地将多个描述分配到不同的信道上是一个关键问题。可以根据信道的质量和带宽等因素,采用自适应的信道分配策略。

4. 总结与展望

4.1 方案总结

本文介绍了三种不同的DVC方案,分别是混合DVC方案、基于块SW - SPIHT的可扩展DVC方案和基于零填充的鲁棒DVC方案。

方案名称 主要特点 优势 不足
混合DVC方案 结合残差编码、SW - SPIHT编码和帧内模式决策策略 提高率失真性能,避免复杂运动估计,保留低复杂度编码特性 与H.264/AVC的帧间编码仍有差距
可扩展DVC方案 基于块SW - SPIHT,采用带速率自适应“哈希”的二进制运动搜索 实现SNR可扩展性,比特流截断率灵活,具有鲁棒性 低比特率下SPNR较低,解码计算量较大
鲁棒DVC方案 结合多描述编码和零填充方法 增强鲁棒性,保留低复杂度编码特性 可能降低压缩效率,增加解码复杂度

4.2 未来展望

虽然这些方案在不同方面取得了一定的成果,但仍有许多工作有待进一步开展。例如:
- 可扩展DVC方案 :Slepian - Wolf编码中的反馈机制在没有反馈信道时会使系统失效,未来可以研究相似性估计的方法来解决这个问题。同时,由于SPIHT对信道错误比较脆弱,可考虑采用多描述编码(MD)来保护SPIHT的比特流。
- 鲁棒DVC方案 :需要进一步优化零填充的参数和多描述编码的结构,以提高压缩效率和解码效率。同时,研究更有效的信道分配策略,以适应不同的网络环境。

总体而言,分布式视频编码是一个具有广阔应用前景的领域,未来的研究将致力于提高编码效率、增强鲁棒性和实现更多的可扩展性,以满足不同应用场景的需求。

graph LR
    classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
    A(混合DVC方案):::process --> B(可扩展DVC方案):::process
    B --> C(鲁棒DVC方案):::process
    C --> D(未来研究方向):::process
    D --> E(提高编码效率):::process
    D --> F(增强鲁棒性):::process
    D --> G(实现更多可扩展性):::process
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值