1. 介绍
IRN网络,实质就是为了解决图像还原的损失最小化(优化)的问题。(压缩后图像还原)
首先我们采样图像等信号时候是连续的,而在计算机获取时候是离散的!所以,很明显信号状态由连续变为离散,这就会有损失了,那么损失误差是不是在容许的范围内,根据采样得到离散的点能不能还原出连续的信号?这就是该理论产生的原因,它就来帮助你解决这个问题!
该采样定理的结论是:找到信号最大的频率分量,再用2倍于最大频率分量的采样频率对信号进行采样,从理论上解决了,离散信号能够重建出连续信号的问题。
2. 网络结构
-
如下网络结构图,利用小波变换把原图X分解成如图4个分量,这4个分量分别对应高频分量XH,对应三个不同方向的高频分量H(水平)、V(垂直)、D(对角),低分部分XL,对应A。这里的低频分量与双线性插值降采样得到的低分辨率结果是一样的,而高频分量则是在降采样过程中被丢失的信息。
-
各分量输入网络中,由堆叠的缩减模块组成,每个模块都包含一小波变换模块和几个可逆神经网络模块(InvBlocks),每个缩减模块将空间分辨率降低2倍。而这些INVBlocks就是来表示”潜在变量“的,熟悉不,嘿嘿,流模型的本质呢!

-
该可逆神经网络模块中,核心操作就是”分块耦合“!!这里采用了进化版本, Density estimation using Real NVP的仿射变换的耦合!下图就是NVP模型论文的正向缩小和反向放大的耦合原理!

本文介绍了IRN网络,一种用于图像压缩后还原的解决方案,利用小波变换和可逆神经网络结构来保留高频信息并解决信号失真问题。文章详细解释了网络结构,特别是仿射耦合层的作用,以及如何通过squeeze操作处理通道维度。关键部分包括网络正向和反向过程,以及损失函数的设计。最后,引用了相关文献以展示研究成果。
最低0.47元/天 解锁文章
1600

被折叠的 条评论
为什么被折叠?



