可变块大小DCT编码技术详解
1. 固定块大小DCT编码的局限性
在图像压缩领域,固定块大小的离散余弦变换(DCT)编码是一种常见的方法。然而,它存在一个明显的问题:无法同时独立控制图像质量和比特率。人类视觉系统对图像高活动区域(细节丰富的区域)的量化噪声不如对低活动区域(平坦区域)敏感。也就是说,在有细节的区域,量化噪声的可见阈值比平坦区域更高。
2. 可变块大小DCT编码的原理
为了利用人类视觉系统的这一特性,实现更高的压缩率并保证良好的视觉质量,可以采用可变块大小的DCT编码。具体做法是,将量化噪声尽可能隐藏在图像的繁忙区域。
2.1 基于块方差的四叉树分解
一种可行的方法是从一个 $N × N$ 的块开始,其中 $N = 2^m$($m$ 为正整数),通常 $N$ 取值为16或32。以块方差作为度量标准,将 $N × N$ 的块分解为四个 $(N/2) × (N/2)$ 的块,每个 $(N/2) × (N/2)$ 的块又可以根据方差度量进一步细分为四个 $(N/4) × (N/4)$ 的块,这个细分过程可以一直持续到得到 $2 × 2$ 的子块,这就是四叉树分解。完成四叉树分解后,对每个子块进行DCT变换,并使用合适的量化矩阵对DCT系数进行量化。由于较小的块是基于方差得到的,其方差比大的块更高,所以可以对较小的块进行更重的量化,而对较大的子块进行较轻的量化,这样既能提高压缩率,又不会牺牲图像质量。
2.2 基于局部对比度的块细分
除了基于方差的四叉树分解,还可以使用局部对比度作为块细分的度量标准。因为块方差与人类视觉的相关性并不理想,而人类视觉系统对对比度的响应更敏感,所以基于局
超级会员免费看
订阅专栏 解锁全文
488

被折叠的 条评论
为什么被折叠?



