分布式视频编码(DVC)算法的创新与优化
在视频编码领域,分布式视频编码(DVC)是一种备受关注的技术。它旨在降低编码端的复杂度,同时在解码端实现高质量的视频重建。本文将详细介绍两种基于DVC的创新方案:基于LQR哈希的残差DVC和混合DVC(HDVC),并分析它们的原理、框架和实验结果。
1. 基于LQR哈希的残差DVC
1.1 动机
在DVC系统中,Wyner - Ziv帧的量化像素或变换系数X经过信道编码后,仅传输奇偶校验位P。解码器利用奇偶校验位P和边信息Y进行纠错解码以恢复X。边信息Y对主源的估计至关重要,其相关性越强,所需的奇偶校验位越少,压缩率越高,重建质量也越好。
哈希基边信息是一种有吸引力的方法,它通过发送一些编码代表信息来辅助运动估计,使运动估计更准确。然而,哈希位的传输会增加开销,因此需要高效压缩。LQR哈希是当前Wyner - Ziv帧的低质量版本,通过类似于DPCM/DCT的预测编码进行编码,能利用时间依赖性,使比特率接近条件熵。但基于LQR的方法存在冗余问题,尤其是在高比特率时。
另一方面,残差DVC比纯像素DVC性能更好,它对残差D = W - Wre进行Wyner - Ziv编码,其中Wre是对W的简单估计,可在编码器和解码器端获取。Dy = Y - Wre用作Wyner - Ziv解码的边信息。
为了改进当前DVC的率失真性能,提出了基于LQR哈希的残差DVC方案。该方案使用解码后的LQR哈希作为Wre,应用SW - SPIHT对残差进行编码,以减少空间冗余,并通过边信息对小波系数进行细化。
1.2 编码框架
该方案对关键帧进行H.264/AVC帧内编码和解码,对Wyner - Ziv帧进行低复杂度编码和高复杂度解码。
-
低复杂度编码
:
- 生成两种比特流:LQR哈希比特流,通过0 - 运动H.264/AVC粗量化生成;Wyner - Ziv比特流,编码器先通过0 - 运动解码生成Wre,对残差D进行离散小波变换(DWT),然后对小波系数Cd进行SW - SPIHT编码。
- SW - SPIHT编码由DWT、SPIHT和信道编码组成,复杂度与帧内编码相似,使整个系统编码复杂度较低。
-
高复杂度解码
:
- 解码器首先使用解码后的LQR进行运动估计生成Y。
- 计算Dy = Y - Wre并进行DWT,得到小波系数C yd,用作SW - SPIHT解码和细化过程的边信息,得到解码后的Cd 0。
- 进行逆DWT得到差异像素D0,最后W 0 = Wre + D0重建Wyner - Ziv帧。
- 计算运动估计和迭代信道解码使解码复杂度较高,但不影响编码的简便性。
-
SW - SPIHT编解码器
:基于Slepian - Wolf理论的集划分分层树(SPIHT),利用相似图像的SPIHT信息相似性,通过无损Slepian - Wolf模型进一步压缩SPIHT信息。
-
小波系数细化
:细化公式为:
[
C_d^0 =
\begin{cases}
v_{max}, & \text{if } C_d^y \geq v_{max} \
C_d^y, & \text{if } C_d^y \in (v_{min}, v_{max}) \
v_{min}, & \text{if } C_d^y \leq v_{min}
\end{cases}
]
其中,C d0是细化后的最终小波系数值,vmax和vmin是假设对所有位平面(BPs)进行SPIHT解码时小波系数的最大和最小值。细化能纠正C yd的噪声位平面,限制失真,并补偿Cd的重建。
-
基于LQR哈希的运动补偿
:
- 运动估计:找到最佳匹配块和对应运动向量,运动向量计算公式为:
[
MAD(a, b) = \arg \min_{dx, dy} \sum_{j = 0}^{7} \sum_{i = 0}^{7} |L_t(a + i, b + j) - R_t(a + i + dx, b + j + dy)|
]
其中,dx ∈ [-8, 8],dy ∈ [-8, 8],参考帧为解码后的前一帧。
- 运动补偿:使用LQR和匹配块的加权平均值生成补偿块,公式为:
[
block_{comp} = \alpha \times block_{matched} + (1 - \alpha) \times block_{LQR}
]
其中,blockmatched是LQR帧中块blockLQR的匹配块,α是实验值,范围在[0, 1]。
1.3 实验结果
对15Hz QCIF序列Foreman和Hall的100个亮度帧进行测试,考虑所有关键帧和Wyner - Ziv帧的恒定解码视频质量。
|序列|Q1|Q2|Q3|Q4|Q5|
| ---- | ---- | ---- | ---- | ---- | ---- |
|Foreman - QP|41|36|32|26|20|
|Foreman - BP|2|3|4|5|6|
|Hall - QP|40|33|29|24|19|
|Hall - BP|2|3|4|5|6|
- PSNR比较 :与非残差DVC相比,提出的DVC方案PSNR提高1.2 - 5.8dB;与文献中最佳结果相比,Foreman序列提高1.2 - 3dB;与H.264/AVC帧内编码相比,PSNR提高达6dB,但与最先进的H.264/AVC帧间编码仍有差距。
- PSNR时间演变 :优化的组合量化使高、低运动序列的解码视频质量恒定。
- GOP大小影响 :对于低运动序列(如Hall),较大的GOP能改善率失真性能;对于高运动序列(如Foreman),GOP增大时率失真曲线下降,因为边信息质量变差。
以下是基于LQR哈希的残差DVC编码流程的mermaid流程图:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A[Wyner - Ziv帧]:::process --> B[LQR哈希编码]:::process
A --> C[生成Wre]:::process
C --> D[计算残差D = W - Wre]:::process
D --> E[DWT分解]:::process
E --> F[SW - SPIHT编码]:::process
B --> G[LQR哈希比特流]:::process
F --> H[Wyner - Ziv比特流]:::process
I[关键帧]:::process --> J[H.264/AVC帧内编码]:::process
J --> K[解码关键帧]:::process
K --> L[运动估计生成Y]:::process
L --> M[计算Dy = Y - Wre]:::process
M --> N[DWT分解]:::process
N --> O[SW - SPIHT解码]:::process
O --> P[小波系数细化]:::process
P --> Q[逆DWT]:::process
Q --> R[计算W 0 = Wre + D0]:::process
R --> S[重建Wyner - Ziv帧]:::process
G --> T[解码器]:::process
H --> T
2. 混合DVC(HDVC)
2.1 动机
当前DVC方案主要分为像素域DVC和变换域DVC。变换域DVC使用变换域Wyner - Ziv编解码器,如一些方案应用离散余弦变换(DCT)来利用帧内空间相关性,但DCT系数带的组合量化选择困难。残差DVC通过对当前帧和参考帧的残差进行编码,能利用时间相关性,性能与DCT域DVC相近,且克服了组合量化选择的困难。
然而,残差帧中仍存在空间相关性,若采用合适的变换编码和易于组合的量化方法,可进一步提高率失真性能。同时,当前变换域Wyner - Ziv编解码器假设待编码源与其边信息的时间相关性在空间上是平稳的,忽略了不同空间位置的时间相关性差异。
因此,提出了混合DVC(HDVC)方案,它结合了残差编码、SW - SPIHT编码和帧内模式决策技术。该方案应用小波域Wyner - Ziv编解码器对小波块(WB)进行编码,利用时间和空间相关性;对每个WB进行帧内模式决策,根据时间和空间相关性选择编码方式。实验结果表明,HDVC在PSNR上比纯SW - SPIHT提高达4.1dB,比残差DVC提高3.2dB,比最新的DCT域DVC提高3dB,且帧内模式决策在高运动区域可提高PSNR达2.1dB。
2.2 编码框架
HDVC的框架与当前DVC方案相比,主要贡献在于:
- 对WB应用小波域Wyner - Ziv编解码器,便于时间和空间相关性分析。
- 使用残差帧构建WB,以更好地利用时间和空间相关性。
- 对每个WB进行小波域帧内模式决策,根据不同的时间和空间相关性选择编码方式。
- 基于时间和空间标准的帧内模式决策策略。
以下是HDVC的编码框架mermaid流程图:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A[Wyner - Ziv帧]:::process --> B[计算残差D = W - Wre]:::process
B --> C[DWT分解]:::process
C --> D[划分WB]:::process
D --> E[帧内模式决策]:::process
E --> F{选择编码方式}:::process
F -->|SW - SPIHT| G[SW - SPIHT编码]:::process
F -->|intra - SPIHT| H[intra - SPIHT编码]:::process
G --> I[Wyner - Ziv比特流]:::process
H --> J[intra比特流]:::process
E --> K[生成模式比特流]:::process
L[关键帧]:::process --> M[H.264/AVC帧内编码]:::process
M --> N[解码关键帧]:::process
N --> O[运动估计生成Y]:::process
O --> P[计算Dy = Y - Wre]:::process
P --> Q[DWT分解]:::process
Q --> R[划分WB]:::process
R --> S[解码模式比特流]:::process
S --> T{选择解码方式}:::process
T -->|SW - SPIHT| U[SW - SPIHT解码]:::process
T -->|intra - SPIHT| V[intra - SPIHT解码]:::process
U --> W[逆DWT]:::process
V --> W
W --> X[计算W 0 = Wre + D0]:::process
X --> Y[重建Wyner - Ziv帧]:::process
I --> Z[解码器]:::process
J --> Z
K --> Z
2.3 小波域Wyner - Ziv编解码器设计
残差DVC已被证明与DCT域DVC性能相当,因为它能在编码器端利用时间相关性。参考帧Wre通过加权平均插值获得:
[
W_{re} = \alpha K_j^0 + \beta K_{j + 1}^0
]
其中,$K_j^0$和$K_{j + 1}^0$是前一个和后一个解码关键帧,$\alpha = 1 - l/g$,$\beta = 1 - \alpha$,l是当前帧与前一个关键帧$K_j^0$在同一图像组(GOP)中的帧数,g是GOP中的帧数。
编码器对残差帧D = W - Wre进行DWT分解,得到小波系数Cd;解码器对残差帧Dy = Y - Wre进行相同的DWT分解,得到小波系数C yd,其中Y是通过关键帧的运动估计插值生成的更准确的当前帧估计。
2.4 小波块(WB)的帧内模式决策策略
WB是基本编码单元,Cd和C yd通常被划分为16×16的跨尺度WB。每个WB包含不同尺度的系数向量。
编码选择取决于时间和空间分析得出的相关性。通过计算以下两个标准来进行决策:
-
时间标准
:基于当前WB的低频能量ELL,计算公式为:
[
E_{LL} = \sum_{i = 1}^{N_{LL}} (C_{LL}^i)^2
]
其中,$C_{LL}^i$是LL(3)带中的第i个系数,$N_{LL}$是LL(3)中的系数总数,$N_{LL} = 4$。
-
空间标准
:基于当前WB高频系数的方差,计算公式为:
[
\sigma^2 = \frac{1}{N_h} \sum_{i = 1}^{N_h} |C_h^i|^2 - (\frac{1}{N_h} \sum_{i = 1}^{N_h} C_h^i)^2
]
其中,$C_h^i$是所有高频带中的第i个系数,$N_h$是高频带中的系数总数,$N_h = 12$。
决策规则如下:
- 当ELL ≥ T1时,假设当前WB与其边信息的时间相关性较弱,使用intra - SPIHT编码。
- 当T2 ≤ ELL < T1且$\sigma^2$ ≤ T3时,低频系数集中大部分能量,高频系数在空间上集中在小值,适合intra - SPIHT编码。
- 当ELL < T2时,推断时间相关性强,使用SW - SPIHT编码。
编码器根据帧内模式决策生成Wyner - Ziv比特流、intra比特流和二进制模式比特流,并进行熵编码后发送到解码器。解码器根据解码后的模式比特流选择LDPCA解码或熵解码来恢复比特流。
综上所述,基于LQR哈希的残差DVC和混合DVC(HDVC)方案通过创新的编码策略和模式决策技术,在率失真性能上取得了显著的提升,为分布式视频编码的发展提供了新的思路和方法。
分布式视频编码(DVC)算法的创新与优化
3. 两种方案的优势与应用前景
3.1 基于LQR哈希的残差DVC优势
- 率失真性能提升 :该方案结合了残差编码和LQR哈希,有效利用了时间和空间相关性,在PSNR上相较于非残差DVC和其他相关方案有显著提升。例如,与非残差DVC相比,PSNR提高1.2 - 5.8dB,这意味着在相同的比特率下可以获得更高质量的视频重建。
- 低复杂度编码 :LQR编码不使用任何计算密集的运动估计,且SW - SPIHT编码复杂度与帧内编码相似,使得整个系统的编码复杂度较低,适合对编码实时性要求较高的应用场景,如移动设备上的视频拍摄和传输。
- 保留DVC特性 :在提高性能的同时,仍然保留了DVC编码端简单的特性,便于在资源受限的设备上实现。
3.2 混合DVC(HDVC)优势
- 综合利用相关性 :通过将小波域Wyner - Ziv编解码器应用于残差帧的小波块(WB),并进行帧内模式决策,能够同时利用时间和空间相关性,进一步提高了率失真性能。实验结果显示,HDVC在PSNR上比纯SW - SPIHT提高达4.1dB,比残差DVC提高3.2dB。
- 灵活的编码选择 :帧内模式决策策略根据WB的时间和空间相关性选择合适的编码方式(intra - SPIHT或SW - SPIHT),使得编码更加灵活,能够适应不同的视频内容和场景。
- 高运动区域优化 :在高运动区域,帧内模式决策能够提供高达2.1dB的PSNR提升,有效改善了高运动视频序列的编码质量。
3.3 应用前景
这两种方案在多个领域具有广阔的应用前景:
-
移动视频通信
:随着移动设备的普及,对视频实时传输的需求越来越高。基于LQR哈希的残差DVC和HDVC的低复杂度编码特性能够减少移动设备的计算负担,同时保证视频的传输质量,适用于移动视频通话、直播等场景。
-
无线传感器网络
:无线传感器网络中的节点通常资源有限,需要高效的视频编码方案。这两种方案能够在低比特率下实现较好的视频重建,满足传感器节点的通信和存储需求。
-
云计算视频处理
:在云计算环境中,视频数据的传输和处理是关键问题。基于LQR哈希的残差DVC和HDVC可以减少数据传输量,提高云计算平台的处理效率。
4. 总结与展望
本文介绍的基于LQR哈希的残差DVC和混合DVC(HDVC)方案是分布式视频编码领域的重要创新。它们通过独特的编码策略和模式决策技术,在率失真性能上取得了显著的提升,同时保留了DVC编码端简单的特性。
| 方案 | 主要优势 | 性能提升 | 适用场景 |
|---|---|---|---|
| 基于LQR哈希的残差DVC | 结合残差编码和LQR哈希,低复杂度编码 | PSNR提高1.2 - 5.8dB(与非残差DVC相比) | 移动视频通信、无线传感器网络 |
| 混合DVC(HDVC) | 综合利用时间和空间相关性,灵活编码选择 | PSNR比纯SW - SPIHT提高达4.1dB | 云计算视频处理、高运动视频场景 |
未来,随着视频技术的不断发展,这些方案还有进一步优化和拓展的空间。例如,可以探索更高效的哈希编码方法,进一步降低LQR哈希的比特率;或者改进帧内模式决策策略,使其能够更准确地适应不同的视频内容。同时,将这些方案与其他视频编码技术相结合,可能会带来更优的性能和更广泛的应用。
以下是两种方案优势对比的mermaid流程图:
graph LR
classDef process fill:#E5F6FF,stroke:#73A6FF,stroke-width:2px;
A[基于LQR哈希的残差DVC]:::process --> B[率失真性能提升]:::process
A --> C[低复杂度编码]:::process
A --> D[保留DVC特性]:::process
E[混合DVC(HDVC)]:::process --> F[综合利用相关性]:::process
E --> G[灵活的编码选择]:::process
E --> H[高运动区域优化]:::process
B --> I[PSNR提高1.2 - 5.8dB]:::process
F --> J[PSNR比纯SW - SPIHT提高达4.1dB]:::process
综上所述,基于LQR哈希的残差DVC和混合DVC(HDVC)为分布式视频编码技术带来了新的发展方向,有望在未来的视频应用中发挥重要作用。
分布式视频编码(DVC)算法创新与优化
超级会员免费看
1610

被折叠的 条评论
为什么被折叠?



