✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。
我是Srlua小谢,在这里我会分享我的知识和经验。🎥
希望在这里,我们能一起探索IT世界的奥妙,提升我们的技能。🔮
记得先点赞👍后阅读哦~ 👏👏
📘📚 所属专栏:传知代码论文复现
欢迎访问我的主页:Srlua小谢 获取更多信息和资源。✨✨🌙🌙
目录
本文所有资源均可在该地址处获取。
本文选自"iWave:CNN-based Wavelet-like Transform for Image Compression",源码可以通过附件查看
背景及动机
小波变换作为一种强大的多分辨率时频分析工具,已经被广泛应用于许多图像处理任务,如去噪、增强、融合,特别是压缩。由于基的局部支持,小波变换在处理具有点奇异性的信号时,相比具有全局支持的傅里叶变换系列具有优势。小波变换引导了成功的图像编码标准JPEG-2000。然而,已经报道小波变换在处理自然图像时仍然存在局限性。
首先,小波变换对于二维图像通常通过沿水平和垂直方向分别进行两步一维变换。这导致了在处理既非水平又非垂直的图像特征时效率低下。
其次,小波变换通常在整个图像上均匀地执行,即同一组变换核应用于所有地方。然而,自然图像具有局部变化的特征,因此均匀变换和非均匀图像之间存在冲突。
为了克服上述局限性,提出了一些新的类似小波的变换,例如ridgelet、curvelet、contourlet等,它们为具有任意方向特征的图像提供了良好的表示。然而,这些变换采用了过完备基,导致了过多的变换系数,难以有效压缩。
另一系列专门为图像压缩设计的方法选择将图像分成块,为每个块选择一个方向,并沿该方向执行变换,这些方向将被发送到解码器。这些方法通常利用提升方案来实现任意方向变换的灵活性,例如基于自适应方向提升(ADL)的小波变换和基于加权自适应提升(WAL)的小波变换。这些方法比JPEG-2000实现了更高的压缩效率,但代价是增加了复杂性和辅助信息(块方向)。
最近,卷积神经网络(CNN)在不同的图像处理任务中取得了一系列成功,如识别、分割、超分辨率以及与图像压缩相关的任务。CNN在处理自然图像方面具有几个明显的优势。
首先,CNN中的二维卷积核使其能够捕捉图像中的任意方向二维特征。
其次,本地接收域和多个卷积核的集合使其能够同时有效地处理不同的局部特征。
第三,也是最重要的,CNN中的卷积核是从大量图像中学习到的,而不是手工设计的,这意味着CNN更适合处理自然图像。然而,CNN仍然存在一个未解决的问题,即其可解释性,特别是关于网络结构的解释:为什么CNN应该以这种方式构建,而不是那种方式?虽然有直观的解释和有见地的观察,但缺乏系统和数学的答案。
考虑到传统小波及其变种的缺点,以及CNN的成功,本文中提出了一种新的基于CNN的小波类变换,称为iWave。我们的关键思想来源于提升方案,该方案将小波变换分解为一系列预测和更新操作。对于传统小波变换,这些预测/更新操作是线性的;对于提出的iWave,这些预测/更新操作由训练的CNN实现,具有非线性和信号自适应性。
换句话说,iWave采用提升方案并将CNN作为构建块集成到提升方案中。只要CNN是专门为自然图像训练的,iWave在处理自然图像时比传统小波变换更有效。这通过论文的实验结果得到了证实,并且文章采用iWave进行图像压缩并与JPEG-2000进行了比较。
iWave与传统小波变换的区别仅在于基于CNN的预测/更新操作。
本文的技术贡献如下:
- 这是首个提出基于更新优先提升方案的CNN小波类变换的。iWave比作为“黑盒”训练的CNN更具可解释性。
- 为了图像压缩的目的,使用了一种新的训练策略,以端到端方式训练iWave。
- 论文进行了广泛的实验,以验证iWave的有效性,特别是在处理特定类型的不规则纹理时表现出色。
提出的方法
这一小节中提出了用于图像压缩的iWave方法。内容包括三部分:首先介绍iWave作为一种新型的小波类变换的结构;其次介绍获得iWave的训练方法和损失函数。
A.iWave变换
iWave通过在提升方案中引入CNN实现类似小波的变换。与第一代定义为一个函数的平移和缩放的传统小波相比,提升方案提供了更快的就地实现,并且保证了完美重建。论文从压缩任务的需求出发,设计了网络结构,采用了更新优先的提升方案。首先从比较两种提升结构(预测优先和更新优先)开始,随后介绍用于二维图像的iWave变换结构。

图1 预测为先的提升机制

图2 更新为先的提升机制
预测优先提升方案包括三个步骤:分割、预测和更新。
iWave采用了更新优先提升方案,实验表明其性能更好。本质上,用训练好的CNN替代了图1中的预测块。
iWave可以通过在行和列方向分别进行分解,从一维扩展到二维,类似于传统的小波变换。图3展示了iWave用于二维图像的整体变换结构。在行变换之后, iWave对图像进行分解的结果是四个子带:一个粗略子带LL,和三个细节子带HL、LH和HH。尽管iWave是分开进行二维变换,但由于CNN中使用的二维滤波器,它仍然能有效捕捉图像中的特征。
iWave的关键模块是由密集CNN(Dense CNN)实现的预测块,本文中具体的密集CNN结构如图4所示。由于小波具有局部支持基,这与传统提升方案中的滤波器阶数和iWave中CNN的接收域有关。较大的支持范围可以生成更平滑的粗略系数带,但也更可能无法表示图像的边缘。密集CNN实际上具有各种接收域,通过训练过程可以获得最适合自然图像的支持范围。选择使用密集CNN的另一个原因是,可以使用更少的卷积核,这有助于减少模型的规模。本文在每层使用tanh函数作为激活函数,除最后一层外,其他层均使用线性激活函数。需要注意的是,ReLU广泛使用,但在iWave中不适合。

图3 iWave的前向过程

图4 预测CNN的网络结构
B.训练结构和损失函数
本文



最低0.47元/天 解锁文章
870

被折叠的 条评论
为什么被折叠?



