研究背景
传统的JPEG压缩算法对于对抗攻击的防御是有限的,并且在视觉效果方面与原图存在一定差距。因此,需要针对该压缩算法进行改进,使其在保证视觉效果的同时对于对抗攻击有很强的削弱能力,并且最重要的是可以使用原始的JPEG解码算法还原图像。在本文发表之前,同样的五个作者首先研究了使用CNN进行图像压缩的过程(Semantic Perceptual Image Compression using Deep Convolution Networks),提出了Multi-Structure Region of Interest (MS-ROI)与JPEG压缩结合进行图像压缩,最大程度地保留原图的语义信息。
主要贡献
本文主要贡献为改进了文章五个作者之前提出的MS-ROI,提出Augmented MS-ROI,
- 通过检测图像含有丰富语义信息的位置,最大程度地保留这部分图像,从而在图片占用空间基本不变的情况下改善JPEG图像压缩质量
- 通过在中间层加入随机噪声,提升物体检测热力图的鲁棒性
方法介绍
1、MS-ROI
本文主要基于MS-ROI进行讨论,因此首先简单介绍MS-ROI的原理。传统JPEG压