深度学习在视频压缩算法中的应用
1. 视频压缩概述
随着便捷的边缘设备(如智能手机和平板电脑)的普及,以及无线和有线网络带宽的不断增加,视频内容正成为互联网上内容消费的主要方式。像Netflix、YouTube、Facebook等众多内容提供商的涌现,进一步推动了视频内容的消费。同时,为了保障公共安全,摄像头的使用也日益广泛,这使得大量视频内容的传输和记录需求不断上升。因此,高效且经济的视频传输需求愈发迫切。
在过去的二十年里,人们投入了大量的研究和标准化工作,致力于开发创新的视频压缩算法,以在保持观众可接受的视频质量的前提下,将视频内容压缩成更紧凑的表示形式。目前,已经制定了多个视频编码标准,如H.262/MPEG - 2 Video、H.264/MPEG - 4 AVC和H.265/HEVC等。视频编码标准的发展通常遵循这样一个原则:当新的标准在相同质量下的压缩比(如比特率降低)比前一个标准提高至少50%时,新的标准才会被引入。
正在开发的Versatile Video Coding (VVC) 标准预计将是HEVC的下一代标准,它于2020年7月完成制定,计划在相同感知质量下,压缩率比HEVC提高30 - 50%。这一改进是通过对经典混合视频编码设计组件进行诸多小改进实现的。
视频压缩的主要因素包括:
1. 时空域中数据表示的固有冗余性;
2. 人类视觉系统(HVS)对高空间频率的低敏感性;
3. 编码参数和变换系数之间的统计相关性。
所有流媒体视频压缩算法都基于两个基本原则:
1. 通过变换和熵编码去除所有类型数据中的数据冗余,这是一个无损过程;
2. 通过消除对HVS在感知上无关紧
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



