图像与视频处理:运动检测与压缩技术详解
1. 视频处理概述
在过去很长一段时间里,由于高带宽和数据需求,视频处理主要由模拟信号处理主导,如 NTSC、PAL 或 SECAM 系统。图像通常以每秒 25 - 30 帧(FPS)的速度处理,模拟带宽为 6 - 8 MHz。通过交替扫描奇偶行,让眼睛产生两倍帧率的错觉。
随着超大规模集成电路(VLSI)的发展,视频帧的数字处理和存储已成为现实,国际电信联盟(ITU)和动态图像专家组(MPEG)制定的各种标准就证明了这一点。视频处理的大部分研究工作都集中在数字视频的压缩上,因为需要处理的数据量非常巨大。例如,最小的视频尺寸 QCIF 格式,分辨率为 176 × 144 像素,帧率为 30 FPS,采用 4:2:0 颜色子采样,每秒会产生 1.1 MB 的原始数据。而全高清电视(1920×1080,60 FPS)的原始数据速率高达 124 MB/s,1 小时的电影原始数据量可达 446 GB。为了将这样的电影存储在 DVD 上或在合理时间内通过互联网传输,需要进行大量的数据压缩。
由于需要快速处理大量数据,很难使用最新和最先进的压缩技术,如算术编码,因此通常会选择速度更快但可能效果稍差的压缩方法。不过,视频数据包含大量冗余信息。例如,视频序列中相邻的两帧,大部分数据保持不变,只有少数像素可能会在某个方向上发生变化或移动。这可以用于预测方案,即计算当前帧(时间 t)与下一帧(时间 t + 1)的差异,并只传输差异部分。可以直接在原始域中处理帧,也可以先进行变换(如离散余弦变换 DCT),再进行预测。
2. 运动检测
2.1 运动向量计算
在基于预测的编码系统中,计算相邻两帧之
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



