VVC的部署情况

本文来自JVET-w0021提案,该提案包括对VVC已部署的产品和服务、公开可用的软件源代码以及支持VVC标准的相关工具的调查。

可公开获取的软件源代码

VTM:VTM是JVET官方开发的参考软件,包含编码器和解码器。它主要是为了展示编码效率和解释标准中规定的语法和解码过程(不对速度进行优化)。VTM可以作为开发编码器的很好的基础,它使用BSD版权许可证。

InterDigital开发了一个多线程的VTM解码器,并在2020年10月达到相当单线程参考软件6-10倍的加速比。它支持VTM的所有特性,该软件和VTM一样使用BSD版权许可证。根据2021年4月的报告,为了与新的VTM相对应,进一步进行了更新,并利用各种调度和低级更改将速度提高了约10%。

Fraunhofer HHI在2020年开源了VVC编码器VVenC和VVC解码器VVdeC,使用BSD版权许可证。它支持多线程操作、1-pass码率控制、感知QP自适应、MCTF。它定义了4个preset,分别为slow、medium、fast、faster。2020年10月在4K UHD SDR视频上的主观测试表明VVenC在medium档下和VTM的主观质量接近或更好(VTM关闭了MCTF和QP自适应,VVenC开启了。两者都关闭了码率控制),但速度快了100倍。2020年12月,新增了slower挡位,改进了1-pass码率控制,新增了2-pass码率控制。slower挡位和VTM的BD-Rate相近,但是在UHD视频上加速8.6倍,在HD视频上加速5.2倍。

Friedrich–Alexander University Erlangen–Nürnberg开源了一个码流分析器。分析器统计解码后比特流中使用的编码工具和编码模式的出现情况,并可用于评估VVC工具的解码能量和时间需求。它使用BSD版权许可证。

软件解码器

Sharp在2020年6月发布了实时软件解码器,并在2020年12月发布了相应的新闻稿。2020年6月,它宣称能以60fps以上的速度解码码率高达40Mbps的4K CTC UHD码流。

腾讯在2020年10月发布了O266dec解码器和基于FFmpeg/VLC的播放器,支持SIMD和多线程。2020年12月,报告称在VVC CTC下测试,单线程比VTM快3倍,8线程比VTM快20倍。能以60fps的速度解码码率为40Mbps的UHD视频,以200fps的速度解码HD视频。2020年12月,发布了基于Arm Neon的移动端版本。在Apple A14处理器(iPhone 12pro)上单线程解码1080p 8bit视频速度能达到50fps,多线程能达到100fps,在RA配置下解码8bit 4K UHD视频速度能达到30fps。该解码器还支持10bit。

阿里在2020年12月发布了移动端Ali266解码器(Android和iPhone)。该解码器优化了多线程、ARM汇编、cache效率和内存利用,尤其是针对8比特视频。在关闭ALF时对720p,1080p和4K视频能达到实时解码。2021年4月,更新了ALF和CCALF,在安卓上相对于VTM加速15倍(8线程,classA和classB CTC码流)。在大部分手机端,使用3线程可以实时解码720p视频。

Kwai在2020年4月发布了K266Dec。解码器是按照VVC规范从头开始设计的,支持VVC Main profile的所有工具。对于安卓平台,K266Dec可以在华为P40上单线程以33fps的速度解码2K 8bit CTC码流,是VTM11解码器的4.11倍。对于IOS平台,K266Dec可以在iPhone 12 Pro Max上单线程以94fps的速度解码2K 8bit CTC码流,是VTM11解码器的4.78倍。

字节跳动在2021年4月发布了BVC。BVC支持各种平台,包括Android、IOS、Linux、MaxOS和Windows。在iPhone12(A14)上单线程解码4K 8bit码流速度可达到22fps,是VTM11的10倍。6线程解码可达55fps。解码2K 8bit CTC码流,单线程速度可达86fps,是VTM11的8.8倍。

Spin Digital在2021年6月发布了支持VVC的实时解码器和播放器。它支持Scalable Main 10 profile,且在近几代CPU上对8K视频解码能力能达到60和120fps。

服务和编码器产品

字节跳动在2021年4月发布了BVC。VVC中大部分编码工具和特性都在BVC编码器中集成和优化了。此外,它还支持其他特性,例如,场景切换检测、码率控制、多线程。和HM与VTM相比,在RA配置下的BD-Rate、加速比分别为:fast preset(6线程):34.13%(HM),17x(HM),131x(VTM);slow preset(6线程):41.63%(HM),1x(HM),8x(VTM)。

KDDI Research在2020年9月发布了4K@60 fps的实时VVC编码器。

Ateme在2020年9月宣布,其Titan系列产品中支持VVC,并在OTT信道中展示了该技术。

Bitmovin在2020年9月宣布在其视频编码平台支持VVC。

印度流媒体服务商MX PlayerMX TakaTak在2021年6月开始提供使用VVC的OTT服务。

阿里的Ali266编码器,在CTC classs A1 (4K), A2 (4K), B (1080p) 和C (720p)序列上与VTM13.0相比,slow preset在RA配置下的{Y, U, V, YUV} BD-Rate为{10.95%, −6.11%, −4.50%, 7.11%},加速比为227。对于VOD内容,和x265的medium preset相比,Ali266编码器的fast preset在RA配置下的{Y, U, V, YUV} BD-Rate为{−32.87%, −46.07%, −42.70%, −35.35%} }。Ali266编码器的fast preset是面向实时编码,目前在1920×1080 /1080×1920视频上平均速度为19.3fps,1280×720/720×1080视频上平均速度为37.7fps。

码流分析产品

Elecard宣布在2020年4月在StreamEye和StreamAnalyzer产品上支持VVC。

ViCueSoft在2020年晚些时候,在其 VQ Analyzer码流分析产品上支持VVC。

感兴趣的请关注微信公众号Video Coding

### VVC ISAF 的技术背景 VVC(Versatile Video Coding)作为新一代视频压缩标准,在提升编码效率的同时引入了许多新的工具和技术。其中,Intrusive Software-Defined Radio Access Network Function (ISAF) 是一种用于优化网络功能的技术框架[^1]。 #### ISAF 的定义与作用 ISAF 主要应用于软件定义无线电接入网(SD-RAN),通过灵活的软件配置实现对视频数据流的高效处理和传输。它能够动态调整资源分配策略,从而适应不同场景下的带宽需求和延迟敏感度。具体而言,ISAF 提供了一种机制来增强视频帧内预测性能,并支持更高效的码率控制算法[^2]。 #### 实现细节 在实际部署中,ISAF 结合了多尺度分组密集网络(Multi-scale Grouped Dense Network, MGDNet)以及最可能模式列表(Most Probable Mode, MPM)。MGDNet 被设计用来改进帧内预测精度,而 MPM 列表则确保了预测方向的选择更加智能化。以下是其实现的关键点: 1. **MGDNet 集成** 使用深度学习模型提取特征图谱,这些特征被进一步划分为多个子集以匹配不同的分辨率层次结构。此过程显著提高了复杂纹理区域的重建质量。 2. **MPM 扩展** 根据已有资料,即使不启用额外选项如 Multiple Reference Line Prediction (MRL) 或 Intra Sub-partitions (ISP),VVC 中的标准 MPM 列表也已包含六个候选预测模式[^3]。这为后续扩展提供了基础架构。 3. **编译环境搭建** 若要验证上述理论效果,则需按照官方指南完成 VTM 测试平台安装工作。例如,在 Ubuntu 20.04 上执行如下命令可以初始化开发环境: ```bash sudo apt update && sudo apt install build-essential cmake git libnuma-dev git clone https://github.com/VideoCodingTestModel/vtm.git cd vtm/source mkdir build && cd build cmake .. make -j$(nproc) ``` 4. **YUV 至 RGB 转换逻辑** 当前主流做法依赖矩阵运算完成颜色空间变换操作。典型公式如下所示: ```python import numpy as np def yuv_to_rgb(yuv_image): m = np.array([[1., 0., 1.402], [1., -0.344136, -0.714136], [1., 1.772, 0.]]) rgb_image = np.dot(yuv_image[:, :, :3], m.T) rgb_image[..., 0] -= 179.456 rgb_image[..., 1] += 135.456 rgb_image[..., 2] -= 226.816 return rgb_image.clip(0, 255).astype(np.uint8) ``` #### 总结 综上所述,VVC ISAF 不仅继承了传统 RAN 功能的优势,还融入先进的人工智能组件以满足未来超高清媒体服务的需求。其核心理念在于利用软硬件协同效应降低整体功耗水平,同时维持较高的视觉体验指标。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值