有监督与无监督图像质量评估框架解析
在图像质量评估领域,不同的方法各有优劣。下面为大家详细介绍相关的评估方法、提出的新方案以及涉及的定义和操作函数等内容。
现有图像质量评估方法及局限性
| 评估类型 | 具体方法 | 内容 | 局限性 |
|---|---|---|---|
| 全参考图像质量评估(Full-Reference IQA) | [14,15] | 利用多种特征训练回归模型来预测图像质量分数 | 仅提取颜色和亮度特征来学习图像质量评估回归模型,忽略了结构、纹理、形状等重要特征 |
| [16,17] | 提出在实时处理图像时保持图像质量的方法 | - | |
| [18 - 20] | 提供端到端的质量评估框架,使用户能够选择语义、视觉和音频特征的最佳组合 | 自适应算子与保护算子在内容处理方面不同,在内容保护中使用间隙计算视觉连贯性不合适 | |
| 无参考图像质量评估(No-Reference IQA) | [29 - 31] | 使用主观图像分数训练模型来预测失真图像的质量 | 训练的模型严重依赖人类评分的图像,不如客观分数准确 |
| [37,38] | 使用全参考图像质量评估方法对模型进行注释和训练 | 使用全参考图像质量评估方法预测不同失真水平和类型的图像可能不准确且不充分 | |
| [40] | 先在服务器端训练深度无监督网络,然后在客户端进行无参考测量 | 未考虑处理时间和复杂度,尤其是在实时工作场景下 |
新方案的贡献
为了在实时处理中找到改变后内容的质量与用户预期结果之间的公平平衡,提出了以下贡献:
-
自适应无参考人脸质量估计
:
1.
图像分区与CNN分类
:首先将图像分割成多个小块,使用卷积神经网络(CNN)根据结构相似性指数(SSIM)、基于内容的图像检索(CBIR)和感知连贯性度量(PCM)对每个小块进行质量分数分组。这样做的原因是图像的失真分布可能不均匀,且避免在调整图像大小时丢失重要信息。
2.
无监督神经网络聚类
:使用无监督神经网络对每个质量组内的小块进行聚类,以学习子级质量分数。这种结合不仅能准确评估特定类型的失真,还能评估失真有变化的图像。
3.
无监督人脸对齐异常检测
:提出使用无监督人脸对齐异常检测来评估无参考图像中的面部特征。这是首次将这些指标结合起来预测图像质量,同时考虑了大量特征来训练神经网络。
-
高效图像流评估框架
:开发了一个能够有效评估图像流并估计其质量的框架。
相关定义
-
数据模型
:
-
图像(Image)
:用
im ≺DESC, F, SO ≻表示,其中DESC是用户提供的文本描述、关键字或注释集合;F是描述图像的特征集合;SO是表示图像中感兴趣对象的显著对象集合。 -
显著对象(Salient object)
:用
so ≺w, h, coord, DESC, F ≻表示,w和h是显著对象的宽度和高度,coord是其坐标,DESC是相关文本描述,F是揭示显著对象视觉内容的特征集合。 -
实体(Entity)
:用
e表示,是独立存在的语义对象,每个实体由一组显著对象表示,这些对象可能失真也可能不失真。 -
多媒体数据流(Multimedia data stream)
:用
mds = im1, im′2, ..., imk表示,是无限的图像序列,可能包含失真和无失真的图像混合。
-
图像(Image)
:用
-
数据操作函数
:
-
图像操作函数(Image manipulation function)
:用
imf(so, im)表示,它修改、抑制或删除图像im中显著对象so的一组特征,并返回修改后的显著对象so'。主要有保护函数和自适应函数,保护函数用于隐藏图像内容以保护敏感信息,自适应函数用于满足资源约束。 -
实体操作函数(Entity manipulation function)
:用
emf(e, mds) = (imf1(so1, im1) ◦ ... ◦ imfi(son, imn))表示,它结合多个图像操作函数,修改多媒体数据流mds中表示实体e的显著对象的特征,并返回一组修改后的显著对象SO'。
-
图像操作函数(Image manipulation function)
:用
数据质量评估
-
神经网络架构用于图像质量评估
:
- 监督神经网络模块 :使用卷积神经网络(CNN)作为监督网络,输入是失真图像的提取小块,输出是每个小块的预测质量分数。该模块使用结构相似性指数(SSIM)、感知连贯性度量(PCM)和基于内容的图像检索(CBIR)进行训练。CNN通过卷积、最大池化、全连接和softmax层提取图像特征并预测质量分数。
-
无监督神经网络模块
:
- 特征提取 :对预测出相同质量类别的小块,根据颜色、对比度和纹理特征进行聚类。颜色特征通过提取RGB颜色并归一化得到灰度值;对比度特征使用RMS对比度计算;纹理特征使用局部二值模式(LBP)方法计算。
- 聚类操作 :将过滤输出连接成3D特征向量,使用K - 均值聚类和欧几里得距离对小块进行质量聚类,得到每个质量组内的质心集合。
-
图像质量计算
:对于给定的失真图像,通过以下步骤计算其质量:
- 小块分区和特征提取 :将图像分割成K个小块并提取特征向量。
- 聚类分配 :找到每个小块特征向量在每个质量组中最接近的质心,将小块分配到相应的聚类中。
- 小块质量估计 :根据小块特征向量与最接近质心的距离,使用加权平均规则确定小块的最终质量分数。
- 最终图像质量分数 :计算所有小块质量分数的平均值得到图像的最终质量分数,分数范围在0到1之间,分数越高表示质量保留越好。
以下是无监督神经网络模块中部分特征计算的流程图:
graph LR
A[输入小块图像] --> B[提取颜色特征]
B --> C[归一化颜色值]
C --> D[计算灰度值]
A --> E[计算对比度特征]
A --> F[计算纹理特征]
D --> G[连接特征向量]
E --> G
F --> G
G --> H[K - 均值聚类]
H --> I[得到质心集合]
-
人脸对齐异常检测
:
-
特征提取
:从人脸中提取68个面部标志点,选择眼睛、鼻子和嘴巴的关键点,计算关键点之间的距离,得到一个5维浮点向量
FA作为人脸的5点特征。 -
聚类操作
:对这些向量应用k - 均值聚类,创建K个聚类,得到每个聚类的质心特征向量
Fi。 - 异常检测 :使用欧几里得距离评估面部标志点的分布,如果距离接近0,则面部标志点更可能对齐;如果距离大于最接近聚类的标准差,则表示面部标志点的位置未得到保留。
-
特征提取
:从人脸中提取68个面部标志点,选择眼睛、鼻子和嘴巴的关键点,计算关键点之间的距离,得到一个5维浮点向量
通过以上方法,能够更全面、准确地评估图像质量,尤其是在实时处理和人脸相关图像的质量评估方面具有重要意义。
有监督与无监督图像质量评估框架解析
图像质量评估的优势与应用场景
上述的图像质量评估方法在多个领域展现出显著优势和广泛的应用场景:
-
实时监控领域
:在实时监控系统中,需要对大量的视频图像进行快速质量评估。通过使用有监督与无监督相结合的图像质量评估框架,能够在实时处理的过程中,准确判断图像是否存在失真、模糊等问题,确保监控画面的清晰和有效。例如,在安防监控场景中,及时发现图像质量问题可以避免因图像模糊而导致的关键信息丢失,提高监控系统的可靠性。
-
人脸相关应用
:在人脸识别、人脸验证等应用中,人脸图像的质量直接影响识别和验证的准确性。该框架中的人脸对齐异常检测和自适应无参考人脸质量估计方法,能够对人脸图像的质量进行精细评估,确保人脸特征的完整性和准确性,从而提高人脸相关应用的性能。例如,在门禁系统中,准确的人脸质量评估可以减少误识和拒识的概率,提升系统的安全性。
-
多媒体内容处理
:在多媒体内容的制作、传输和存储过程中,图像质量的评估至关重要。通过该框架,可以对图像进行实时质量评估,根据评估结果对图像进行优化处理,如调整图像的亮度、对比度等参数,以提高图像的视觉效果。同时,在图像的传输过程中,可以根据网络状况和图像质量要求,动态调整传输策略,确保图像在不同环境下都能保持较好的质量。
与其他图像质量评估方法的对比
为了更清晰地了解该框架的优势,将其与其他常见的图像质量评估方法进行对比:
| 评估方法 | 优点 | 缺点 | 与本文框架对比 |
| ---- | ---- | ---- | ---- |
| 全参考图像质量评估 | 能够利用参考图像进行准确评估 | 需要参考图像,在实际应用中受限 | 本文框架无需参考图像,更具灵活性,且考虑了更多特征 |
| 无参考图像质量评估(传统方法) | 无需参考图像 | 评估准确性相对较低 | 本文框架结合了有监督和无监督方法,提高了评估的准确性和泛化能力 |
| 基于深度学习的单一模型评估 | 能够自动学习图像特征 | 可能对特定类型的失真不敏感 | 本文框架综合多种特征和方法,对不同类型的失真都有较好的评估效果 |
未来发展趋势与挑战
虽然该图像质量评估框架已经取得了一定的成果,但在未来的发展中仍面临一些挑战和机遇:
-
实时性要求的提高
:随着技术的发展,对图像质量评估的实时性要求越来越高。未来需要进一步优化框架的算法和结构,减少处理时间,以满足更高效的实时处理需求。例如,在智能交通系统中,需要对车辆抓拍的图像进行实时质量评估,以便及时获取准确的车辆信息。
-
复杂失真类型的处理
:现实中的图像可能会受到多种复杂失真类型的影响,如噪声、模糊、压缩失真等。未来的研究需要进一步提高框架对复杂失真类型的处理能力,确保在各种情况下都能准确评估图像质量。
-
多模态数据的融合
:除了图像数据,多媒体数据还包括音频、视频等多种模态。未来可以考虑将多模态数据进行融合,综合评估多媒体内容的质量,以提供更全面的用户体验。例如,在视频会议系统中,同时评估图像和音频的质量,确保会议的顺利进行。
总结
本文详细介绍了有监督与无监督图像质量评估框架,包括现有评估方法的局限性、新方案的贡献、相关定义、数据质量评估的具体方法以及该框架的优势、应用场景、与其他方法的对比和未来发展趋势。通过结合有监督和无监督神经网络,以及人脸对齐异常检测等方法,该框架能够在实时处理中准确评估图像质量,尤其在人脸相关图像和多媒体数据处理方面具有重要的应用价值。未来,随着技术的不断发展,该框架有望在更多领域得到广泛应用,并不断完善和优化。
以下是图像质量评估流程的总结流程图:
graph LR
A[输入图像或多媒体数据流] --> B[图像分区]
B --> C[监督神经网络模块]
C --> D[预测小块质量分数]
D --> E[无监督神经网络模块]
E --> F[特征提取与聚类]
F --> G[计算小块质量]
G --> H[计算最终图像质量分数]
A --> I[人脸对齐异常检测]
I --> J[提取人脸特征]
J --> K[聚类与异常检测]
K --> L[评估人脸质量]
H --> M[综合评估结果]
L --> M
通过上述的介绍和分析,希望读者能够对有监督与无监督图像质量评估框架有更深入的了解,并在实际应用中充分发挥其优势,提高图像质量评估的准确性和效率。
超级会员免费看
2039

被折叠的 条评论
为什么被折叠?



