解决数据压缩的问题通常可以从三步来分析:第一步是为什么要做,即数据压缩的必要性问题;第二步是为什么可以做,即分析信源数据的特性,并在此基础上进行数据压缩的可行性分析;第三步是在第二步分析的基础上,如何借助信号处理等技术实现对于数据的压缩。以下进行详细的分析。
一、数据压缩的必要性
在数据压缩处理的各种媒体中,视频和音频信息占据了主导地位。这是因为人们所接受的外部信息中,绝大部分是由视觉和听觉获得的。人们对视听享受的要求越来越高,视频从标清视频到高清再到超高清视频,音频从单声道到立体声、环绕立体声和22.2多声道等。下述表格中仅给出不同数字化视频格式中亮度信号的原始码率,包含色度信号的总码率在后续第二章媒体特性与表示中介绍彩色空间后给出。(视音频原始格式的分析也在第二章中给出)
表1数字化视频格式(仅计算亮度信号)
数字视频格式 |
每秒帧数 |
图像分辨率(宽×高,像素) |
样本精度(bit) |
原始码率(Mb/s) |
CIF |
30 |
352×288 |
8 |
24.33 |
ITU-R 601 PAL |
25 |
720×576 |
8 |
82.944 |
HDTV 1080P |
30 |
1920×1080 |
8 |
497.664 |
UHDTV1(4K) |
60 |
3840×2160 |
10 |
4976.64 |
UHDTV2(8K) |
120 |
7680×4320 |
10 |
39813.12 |
由上述数据可见:在人们常用的数据格式中,视频、图像、音频和语音等数据量是相当巨大的,尤其是视频图像的数据量。这仅是人们日常生活中经常接触到的数据类型。为探索更多人类未知的领域,诸如航空探测、基因分析、地质勘探等活动每天将产生以太字节和拍字节计的数据量(太:1012,拍:1015)。即使目前的存储介质成本迅速下降,但仍然赶不上数据量急剧增加的速度。从另一方面说,有些情况下的存储和传输能力也无法显著提高。例如,通过无线电波进行数据传输总是受到大气特性的限制。因此,高效数据压缩技术的研究和实现仍是人们坚持不懈的追求目标。
对原始信源的分析是非常重要的,不仅需要理解其数据构成的原理,还要熟悉其数据格式。例如:为什么视频压缩的对象是YUV,而不是RGB