基于CNN的类DCT变换用于图像压缩
1. 相关工作
深度学习在图像/视频压缩领域成为新兴热门话题,近两年备受关注。以往多数工作聚焦于类似自动编码器的图像压缩方案,可分为块级和图像级两种方法。
- 块级网络 :Toderici等人提出基于循环神经网络(RNN)的方案,在自动编码器的“编码”部分后插入二进制量化层,比特率由网络结构预先确定。为实现可变比特率,需级联多个自动编码器或多次运行RNN。后来,他们用精心设计的基于RNN的算术编码方法进一步压缩网络输出位。近期,Johnston等人通过在RNN中启用预训练并为不同块分配不同比特率,进一步改进了该方案。不过,这些工作都采用二进制量化,比特率无法任意调整。
- 图像级网络 :Balle等人提出基于全卷积网络模型的方案,采用多级量化(即量化为整数)而非二进制量化,不同量化步长自然能实现任意可变比特率。为训练包含量化的网络,他们提出新的损失函数来近似率失真成本。Theis等人和Rippel等人也提出类似方案,但网络结构和近似率失真成本的方法不同。这些方案难以集成到HEVC等现有标准中。
除了类似自动编码器的方案,还有其他深度学习在图像/视频压缩方面的探索。例如,Jiang等人提出基于CNN的图像压缩框架,通过CNN对输入图像进行下采样、压缩,再通过另一个CNN进行上采样;Baig等人提出基于深度学习的彩色化方法,并采用训练好的网络压缩图像的色度分量;Prakash等人提出基于CNN预测感知失真的图像压缩方法。然而,基于深度学习的预测编码和变换编码研究较少,值得进一步探索。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



