基于四叉树分割和多分辨率相关的快速小波分形编码 陈晓棠 余英林 摘 要:提出一种基于四叉树分割和多分辨率相关的快速小波分形编码算法。在对图象小波变换后进行四叉树分割编码的过程中,利用小波变换的多分辨率分析特性,在多分辨率相关的基础上,对分形匹配搜索域进行自适应调整。实验结果证明该算法的有效性:压缩比和信噪比下降很少,编码时间只需十秒钟左右。 1 引言 分形编码在90年代初因其高的压缩比和压缩潜力在图象编码的研究中倍受青睐。分形编码是基于图象局部与整体之间的相似性,利用局部的定义域块经过包括收缩、旋转变换、尺度变换在内的仿射变换,来替代整体中的值域块的迭代搜索的过程。由于分形压缩的编码时间和解码时间很不平衡,编码时间很长,而解码时间很短。而且,由于通常的分形编码采用基于方块的匹配搜索,所以恢复图象存在方块效应,影响视觉质量。近年来,随着对小波研究的深入,小波变换对图象的多分辨率描述逐渐引起了图象编码研究人员的关注,对利用小波进行图象编码展开了研究,并取得了一些成果(如Shapiro[4]的零树编码)。但在小波编码的算法中,由于没有充分利用小波多分辨率图象之间的相似性,所以压缩比有待提高。而我们注意到,这种相似性正是分形编码要达到高压缩比的基础。所以,将分形和小波结合起来编码,充分利用两者的优点,是我们研究分形和小波混合编码算法的初衷。由于在混合编码中,同样存在着搜索域的匹配问题,因此,编码时间较长仍然是该编码算法的瓶颈之一。本文提出的算法,正是为力图有效解决这一问题而提出的。 2 图象的多分辨率小波分解 小波变换具有描述非平稳图象信号的本领和适应人的视觉系统特性的良好品质,其最大特点是能够多分辨率地描述图象信号,并将图象信号分解为一组多尺度子带图象,分解后各子带图象相对平稳,易于编码。我们采用Mallat提出的塔式多分辨率分解算法(文献[1])。得到的小波图象的各个子带分别对应了原图象在不同尺度和不同分辨率下的高频细节分量,以及一个对原始图象的低频分量。从多分辨率分析的角度来看,这些子带之间存在相关性。如对各高频分量,由于它们是图象同一边缘,轮廓和纹理信息在不同方向、不同分辨率下由细到粗的描述,所以在频带中对应边缘、轮廓的相对位置都应是相同或相近的。这种空间位置上的相似性和相关冗余,为我们在小波域内进行分形编码提供了便利。 K(r)i=Iri-J(r)i,(I=0,1,2,…,r) (证明略) 我们令I为原图象,J为原图象减去均值以后的灰度图象,K为均值图象,则对I,J,K作小波变换之后,各子带之间有如下关系:I的最低频子带的系数等于K和J的最低频子带系数之和;K的其余各级子带系数值均为零,即均值图象不存在高频分量;I和J的其余各级子带系数相等。因此,我们可以将小波域内的分形编码视为传统空域的去均值后的分形编码,即在编码过程中不考虑偏置因子(因为值为零)。这样计算分形码时只有尺度因子,可以简化计算,加速编解码过程。 3 原理简述 3.1 方块分形编码原理 4 进一步的加速算法 我们的加速编码基于以下多分辨率相关的假设:假定待编码图象为F,大小为2M×2M,将F进行1:2n (n=1,2,...)抽样得到的缩小的低分辨率图象G,大小为2n-1M×2n-1M。对图象G编码,若以(x,y)为起始点的最佳匹配映射的起始点为(x1,y1),则对图象F编码时,以(2nx,2ny)为起始点的编码方块的最佳匹配映射,在一定误差门限的限制下,在(2n-1x1,2n-1y1)的δ邻域内概率较大。据我们实验统计,以五级小波分解后分形匹配为例,在以第一级分形匹配的(dx,dy)对应的该级子带(2dx,2dy)为中心的2邻域内概率近70%,3邻域内近80%,而到第四级分形匹配时,在其4邻域内的概率均达到90%以上。因此,根据此假定带来的误差在算法中是可以允许的。我们后面的实验也证实了这一点。而由前知道,对图象做小波分解后,可得到大小依次为1:2n的分辨率由低到高的多分辨率图象,这样我们利用小波多分辨率分析的特点,在搜索过程中将多分辨率相关假定结合进去,是很自然的一个想法。 5 实验结果及分析 对512×512×8的Lena图象做如上实验,实验平台为PII300,邻域值的大小根据具体要求设定。本文权衡各相关因素,选取邻域,并随分解深度的增加而增大一倍。各级子带的阈值大小由实验来不断调整,不同方向不同分解级的子带其阈值也相应的不同。这样可以根据各级子带系数的重要性不同,合理降低其匹配精度。实验原始图象和恢复图象如图1所示。表1列出了不同阈值时的四叉树分割算法和进一步加速算法的结果(未进行熵编码)。若进行熵编码,则数据量还可以进一步压缩。 图1 实验图象和恢复图象 表 1 实验结果列表 |
![]() | 四叉树分割 | 四叉树分割结合多分辨率相关 | ||||||
信噪比 (dB) | 压缩比 (倍) | 编码时间 (秒) | 文件长度 (bytes) | 信噪比 (dB) | 压缩比 (倍) | 编码时间 (秒) | 文件长度 (bytes) | |
1 | 31.33 | 30.20 | 75 | 8680 | 30.9 | 28.16 | 16.5 | 9310 |
2 | 30.50 | 38.33 | 50 | 6839 | 30.14 | 36.90 | 12.3 | 7105 |
3 | 29.60 | 46.76 | 41.2 | 5606 | 29.64 | 42.56 | 10.5 | 6159 |
4 | 29.21 | 50.27 | 35.2 | 5215 | 29.38 | 49.05 | 9.5 | 5438 |
5 | 28.27 | 61.23 | 26.7 | 4281 | 28.04 | 61.11 | 7.8 | 4290 |
6 结论 由此可见,本文的算法还是比较有效的。编码时间大大加快,压缩比和信噪比稍有减少。这是因为缩小搜索域后,找不到误差范围内在搜索域外的最佳匹配块,所以要进行四叉树分割继续搜索,这样就增加了需存储的信息,导致压缩比会轻微降低。与同类方法相比,例如相对于基于块分类的加速算法,本文在压缩比和信噪比方面占有优势,且保持图象质量不太受影响,而编码时间也可以和其它方法相比,本文结果没有采用熵编码如算术编码等,如果采用,还可以进一步提高压缩比。 本文获国家自然科学基金69972076资助 参考文献 1 S. Mallat. A Theory for Multiscale Signal Decomposition: the Wavelet Representation. IEEE Trans, Patt. Anal and Mach, Intell. 1989.11 pp.674~693 |