摘要
Guetzli是一种新的JPEG编码器,旨在以比其他常见的JPEG编码器更低的比特率产生视觉上无法区分的图像。它使用闭环优化器优化JPEG全局量化表和每个JPEG块中的DCT系数值。Guetzli使用我们的感知距离度量Butteraugli [1]作为其优化过程中的反馈来源。根据Butteraugli,与我们尝试的其他压缩机相比,我们在给定的感知距离上减少了29-45%的数据大小。Guetzli的计算目前是非常缓慢的,这限制了其压缩静态内容的适用性,并作为一个概念证明,通过将高级心理视觉模型与有损压缩技术结合起来,我们可以大大减少大小。
1、介绍
平均网页大小的三分之二用于图像表示:JPEG,GIF和PNG; 几乎一半的图像请求是JPEG,其字节大小比PNG和GIF大得多[2]。由于许多客户端,特别是移动客户端受到传输带宽的限制,我们可以通过减小大小来加快网站加载速度 的JPEG图像。 通过调整质量参数,标准JPEG编码器可通过调整尺寸来缩小视觉质量。 在这项工作中,我们研究如何减小JPEG图像的大小,而不会影响图像的感知视觉质量。
我们在视觉上观察到用现有编码器编码的JPEG通常具有不均匀的质量; 他们经常只在图像的几个地方展示令人不安的文物。 通常,接近锋利边缘或线条的区域表现出更可见的伪影(例如,如图1所示)。 这导致我们认为进一步优化是可能的。 我们假设当编码器以有效的方式丢弃信息时,JPEG图像应该在恶化开始变得可见时开始大致均匀地降级。使用Guetzli,我们尝试导致视觉质量下降更均匀 并产生较小的JPEG图像
Guetzli是一种开源的JPEG编码器[3],其针对非常高的感知品质。它执行闭环优化,由我们的人类视觉模型的Butteraugli提供反馈[1]。它的目标是根据Butteraugli发现人眼不能与原始图像区分的最小的JPEG。 Butteraugli考虑到大多数JPEG编码器没有使用的三个视觉特性。首先,由于锥体的灵敏度谱的重叠,伽马校正不应该分别应用于每个RGB通道。例如,看到的黄光量和对蓝光的敏感度。因此,可以更精确地编码黄色附近的蓝色变化(图2)。 YUV色彩空间定义为伽马压缩RGB的线性变换,因此不足以对这种现象进行建模。第二,人眼在蓝色中的分辨率比