关于Bit Depth SVC

最新推荐文章于 2025-04-17 11:55:34 发布

云博士的AI课堂

最新推荐文章于 2025-04-17 11:55:34 发布

阅读量535

点赞数

文章标签： scalability h.264 extension 工作图像处理 video

H.264/SVC 专栏收录该内容

30 篇文章

订阅专栏

本文回顾了H.264/SVC中的Bit-depth scalability技术，主要介绍了HHI和Thomson两家机构的不同实现方案。HHI采用inversetonemapping技术进行层间预测，而Thomson则扩展了spatial SVC的多种层间预测方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

CSVT上又有一篇Yuwen Wu的关于bit depth SVC的文章了，大致浏览了一遍感觉没啥新东西，还是那些文字翻来覆去的。写篇总结复习一下看过的bit depth SVC，免得过段时间又忘干净了。

Bit depth scalability是在H.264/SVC在完成phase1后，提出的后续的phase2的需求（此外还包括FGS，色度采样分级和颜色空间分级）。为不失一般性，通常用BL为8bit，EL为10bit来讨论。Bit depth SVC目前最主要的贡献来自于两方面，一是HHI，另一是Thomson，以下分别简介。

1. HHI
Schwarz, Wiegand等人在07年做了一部分Bit depth SVC的工作，参见论文 Bit-depth Scalable Video Coding（ICIP07）和相应JVT提案（记不清提案号了-__-）。提出了如下的框架：

很容易看出，HHI的inter layer prediction框架非常简单，一句话就能说明白，即用BL的重构信号来得到EL的预测信号（spatial domain prediction）。关键的问题在于如何将8bit的重构样值转化为10bit，事实上这个话题并不是什么新东西，在图像处理领域已有tone mapping技术（高bit depth图像向低bit depth图像映射）的研究，因此这里HHI采用了所谓的inverse tone mapping。一共有三种inverse tone mapping被使用，可以在PPS中加入语法元素来选择使用哪一种。这三种技术为：
a. linear scaling: 就是最简单的将8bit样值左移2位，得到10bit数据。等价于10bit depth样值的低2位为0；
b. linear interpolation: 通过已有的8bit-10bit样值对应关系，做线性插值求出当前8bit对应的10bit数值；
c. look up table mapping: 用现成的表（用SEI传输）查表做映射。

HHI的结构简单的同时存在着缺陷，最明显的问题就是没有满足single loop constraint，BL必须完全解码得到重构样值才能对EL做预测。

2. Thomson
Yuwen Wu等人在Bit depth SVC做了很多工作，具体参见Bit-depth scalability compatible to H.264/AVC-scalable extension（JVCI）和H.264/Advanced Video Coding (AVC) Backward-Compatible Bit-Depth Scalable Coding（CSVT）以及相应JVT提案。相对于HHI，Thomson基本上将现有spatial SVC三种inter layer prediction都扩展到了bit depth SVC中。

左图为intra MB的方法，类似于HHI的方法用8bit重构样值做EL预测，当然这是符合single loop constraint的。右图为inter MB的情形，显然与inter-layer motion prediction和inter-layer residual prediction十分吻合。Thomson方案的另一优点是能够实现MB level的自适应，EL的MB既可以采用层间预测也可以使用层内预测。一切都与spatial SVC十分类似。

在文献中，Thomson做了一些定量的研究工作，来验证这样的方案（主要是residual prediction）是否是有效的。最终的结论是bit-depth SVC的层间预测与spatial SVC是基本有效的。详细的推导请看paper。

3. 其它
在icassp上有篇文章“创造性”的提出了用高bit depth做BL，低bit depth做EL的方案。。。
intel在JVT也有过一个提案，类似于HHI的方法，采用了Wiener Filter做inverse tone mapping。

总结
目前Bit depth SVC现有的这些技术在压缩效率上仍不能令人满意。而研究也处于停滞，一方面由于没有什么新的idea涌现，另一方面是JVT本身陷入拆分门而放缓了很多工作。不瞎猜了。