视频压缩技术全解析
1. 视频压缩基础操作
1.1 变换操作
在视频编码中,变换操作是重要的一环。它将数据转换为更易于压缩的格式。过去,8×8离散余弦变换(DCT)常用于视频编码,但在现代编解码器中,它已被更简单的4×4变换所取代。
1.2 量化操作
量化是为了进一步压缩而对变换操作的输出进行处理的过程。与前面的阶段不同,量化是一种有损操作。量化在变换域中进行,以实现感知编码,即对人眼最敏感的系数给予更高的精度。通常,低频分量的量化粒度更细,而高频分量的量化则更粗糙。运动向量也会被量化。
- 量化是编码过程中唯一不可逆的阶段,信息被破坏且无法恢复,这使得视频压缩算法具有有损性。因此,选择正确的量化参数对于使重建信号可接受至关重要。
- 量化阶段会增加块中零值系数的数量,因为许多低值分量会被舍入为零。例如,H.264中典型的4×4块通常只有四个非零样本,这对后续的编码阶段很有帮助。
1.3 熵编码
熵编码是一种使用可变长度码对符号进行高效编码的技术。可变长度编码的原理是对常见符号使用短码,对不常见符号使用长码。
- 示例说明 :以英语为例,简单的编码方案是每个字母用5位编码,如A编码为00000,B编码为00001,直到Z编码为11001,无论编码的文本如何,平均每个字母总是5位。而根据英语字母频率调整的可变长度编码方案,如E编码为011,T编码为000,A编码为1100,Z编码为11111101010。乍一看,这种方案似乎效率不高,因为有些字母的编码位数远超过5位,但对于大段文本,确实能实现压缩。例如,“TEATIME”这个单词平均每个字母约
视频压缩技术核心解析
超级会员免费看
订阅专栏 解锁全文
1657

被折叠的 条评论
为什么被折叠?



