【IQA技术专题】梯度幅值IQA:GMSD

在这里插入图片描述

梯度幅值IQA:Gradient Magnitude Similarity Deviation: An Highly Efficient Perceptual Image Quality Index(2014 IEEE )

本文将围绕《GMSD: Gradient Magnitude Similarity Deviation: An Highly Efficient Perceptual Image Quality Index》展开完整解析。GMSD实现的是有参考的图像质量评价指标,可以有效地对图像的感知(Fidelity)质量进行评估。参考资料如下:
[1]. 论文地址
[2]. 代码地址


专题介绍

图像质量评价(Image Quality Assessment, IQA)是图像处理、计算机视觉和多媒体通信等领域的关键技术之一。IQA不仅被用于学术研究,更在影像相关行业内实现了完整的商业化应用,涉及影视、智能手机、专业相机、安防监控、工业质检、医疗影像等。IQA与图像如影随形,其重要程度可见一斑。

但随着算法侧的能力不断突破,AIGC技术发展火热,早期的IQA或已无法准确评估新技术的能力。另一方面,千行百业中各类应用对图像质量的需求也存在差异和变化,旧标准也面临着适应性不足的挑战。

本专题旨在梳理和跟进IQA技术发展内容和趋势,为读者分享有价值、有意思的IQA。希望能够为底层视觉领域内的研究者和从业者提供一些参考和思路。

系列文章如下:
【1】🔥IQA综述
【2】PSNR&SSIM
【3】Q-Insight
【4】VSI
【5】LPIPS
【6】DISTS
【7】Q-align


一、研究背景

IQA研究者在当时已经意识到PSNR等像素级别的指标,无法很好的在“感知”级别上对图像质量做有效的评估。现有 FR-IQA 模型(如 FSIM)虽精度高,但计算复杂;部分模型(如 SSIM)虽然计算简单,但精度不够。作者想要提出兼具高预测精度和高计算效率的 FR-IQA 模型。
总结该论文结构如下:
在这里插入图片描述

二、GMSD方法

2.1 实验发现

与VSI相似,作者针对不同的退化用自己提出的指标做了一个实验,如下所示,摘取了其中一个退化类型。
在这里插入图片描述
其中,r和d分别是参考图和退化图, m r \text{m}_{\text r} mr m d \text{m}_{\text d} md分别是作者提出的梯度幅值指标所计算的梯度幅值图,GMS是两幅梯度幅值图的相似度,灰度值越大代表着越相似。从中可以看到图像梯度对失真敏感,不同局部结构的失真程度不同,全局变化可反映整体质量

2.2 方法总览

方案如下所示:
在这里插入图片描述
可以看到流程比较清晰,分为两个子部分:

  1. Local Quality Computation:用于描述局部区域的质量,使用 3×3 Prewitt 滤波器来进行提取,公式如下所示。 h x = [ 1 / 3 0 − 1 / 3 1 / 3 0 − 1 / 3 1 / 3 0 − 1 / 3 ] , h y = [ 1 / 3 1 / 3 1 / 3 0 0 0 − 1 / 3 − 1 / 3 − 1 / 3 ] \mathbf{h}_x = \begin{bmatrix} 1/3 & 0 & -1/3 \\ 1/3 & 0 & -1/3 \\ 1/3 & 0 & -1/3 \end{bmatrix}, \quad \mathbf{h}_y = \begin{bmatrix} 1/3 & 1/3 & 1/3 \\ 0 & 0 & 0 \\ -1/3 & -1/3 & -1/3 \end{bmatrix} hx= 1/31/31/30001/31/31/3 ,hy= 1/301/31/301/31/301/3 提取完x和y方向的梯度后,使用以下公式,获取梯度幅值。 m r ( i ) = ( r ⊗ h x ) 2 ( i ) + ( r ⊗ h y ) 2 ( i ) m d ( i ) = ( d ⊗ h x ) 2 ( i ) + ( d ⊗ h y ) 2 ( i ) \mathbf{m}_r(i) = \sqrt{( \mathbf{r} \otimes \mathbf{h}_x )^2 (i) + ( \mathbf{r} \otimes \mathbf{h}_y )^2 (i)} \\ \mathbf{m}_d(i) = \sqrt{( \mathbf{d} \otimes \mathbf{h}_x )^2 (i) + ( \mathbf{d} \otimes \mathbf{h}_y )^2 (i)} mr(i)=(rhx)2(i)+(rhy)2(i) md(i)=(dhx)2(i)+(dhy)2(i) m r \text{m}_{\text r} mr m d \text{m}_{\text d} md分别是参考图和退化图的梯度幅值。最后再计算相似度就可以得到局部的质量估计了。 G M S ( i ) = 2 m r ( i ) m d ( i ) + c m r 2 ( i ) + m d 2 ( i ) + c GMS(i) = \frac{2\mathbf{m}_r(i)\mathbf{m}_d(i) + c}{\mathbf{m}_r^2(i) + \mathbf{m}_d^2(i) + c} GMS(i)=mr2(i)+md2(i)+c2mr(i)md(i)+c其中 c c c是一个用于稳定数值的常数。

  2. Pooling Strategy:使用radient Magnitude Similarity Deviation (GMSD)方法来进行池化提取全局图像质量分数。计算过程中会使用到Gradient Magnitude Similarity Mean (GMSM),两者的公式表示如下: G M S M = 1 N ∑ i = 1 N G M S ( i ) GMSM = \frac{1}{N} \sum_{i=1}^{N} GMS(i) GMSM=N1i=1NGMS(i) G M S D = 1 N ∑ i = 1 N ( G M S ( i ) − G M S M ) 2 GMSD = \sqrt{\frac{1}{N} \sum_{i=1}^{N} \big(GMS(i) - GMSM\big)^2} GMSD=N1i=1N(GMS(i)GMSM)2 作者这里还给出了GMSD相较GMSM的优势,比如说下图:
    在这里插入图片描述
    其中(a) 原始图像 “Fishing”、其受高斯噪声污染的版本(DMOS = 0.4403;GMSM = 0.8853;GMSD = 0.1420 )以及它们的梯度相似图。(b) 原始图像 “Flower”、其模糊版本(DMOS = 0.7785;GMSM = 0.8745;GMSD = 0.1946 )以及它们的梯度相似图。基于人类主观 DMOS,图像 “Fishing” 的质量比图像 “Flower” 高得多,然而二者的GMSM指标接近,而GMSD指标可以有明显差距,因此使用GMSD可以更有效的区分开一些质量分数不一样的数据。

三、实验

使用了以下几个数据集:LIVE(5 种失真)、CSIQ(6 种失真)、TID2008(17 种失真)。

消融实验:这里的消融实验不是针对GMSD来做的,而是其他方法,因为前面已经论述过平均池化没有优势。
在这里插入图片描述
这些方法原本的池化策略要么是平均池化,要么是加权池化。针对不同方法,SD(标准差) 池化的应用方式如下:

  • 对于 MSE、SSIM、G-SSIM、GSD 和 FSIM,直接将 SD 池化应用于它们的局部质量图以生成预测质量分数。
  • 对于 MS-SSIM,在每个尺度的局部质量图上应用 SD 池化,然后将所有尺度上的预测分数相乘作为最终分数。
    除 MSE 外,其他所有 IQA 方法在使用 SD 池化替代原始池化策略后,性能均未得到提升。原因可能在于:这些方法中,局部质量图是通过多种不同类型的特征生成的,特征之间的相互作用可能使图像局部质量的估计变得复杂,从而导致 SD 池化不适用。相比之下,MSE 仅使用原始亮度信息,GMSD 仅使用梯度幅度的亮度信息来计算局部质量图,这可能是 SD 池化对它们有效的原因。

定量实验,作者给出了多个方法的对比结果。
在这里插入图片描述
GMSD 在 CSIQ 和 TID2008 数据库上的 SRC(0.957、0.891)均排名第一,LIVE 数据库与 VIF、FSIM 相当。作者还绘制了一个排名图,这里更清晰的看出GMSD的效果优势。
在这里插入图片描述

对于特定失真类型实验:测试了每种类型失真的性能。
在这里插入图片描述

对于每个数据库和每个失真类型,前三个产生最高SROCC值的IQA指数以黑体高亮显示。GMSD表现非常均衡,除开某些特定的失真,例如CTC,这个失真在VSI中也有提到,是跟颜色相关的。

耗时:对IQA指标的运行速度进行了评价。
在这里插入图片描述

GMSD存在明显优势。

四、总结

本文提出了一种高效的全参考图像质量评估(FR-IQA)模型 ——梯度幅度相似性偏差(GMSD)。该模型通过计算参考图像与失真图像的像素级梯度幅度相似性(GMS) 生成局部质量图(LQM),并采用标准差池化策略(即 GMS 图的标准差)作为最终质量指标。实验表明,GMSD 在LIVE、CSIQ、TID2008三大数据库上的预测精度(如加权平均 SRC 达 0.924)优于多数现有模型,且计算效率极高(处理 512×512 图像仅需 0.0110 秒),兼具准确性与高效性,适用于实时图像质量评估场景。

代码部分将会单起一篇进行解读。(未完待续)


感谢阅读,欢迎留言或私信,一起探讨和交流,如果对你有帮助的话,也希望可以给博主点一个关注,谢谢。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值