Assessing Image Quality Issues for Real-World Problem(论文翻译)
论文翻译
论文地址:Assessing Image Quality Issues for Real-World Problem
数据集和源码地址:https://vizwiz.org
Abstract
我们引入了一个新的大规模数据集,它将图像质量问题的评估与两个实际的视觉任务联系起来:图像字幕和视觉问题回答。
首先,我们针对39181张盲人拍摄的图片,从6个选项中确定每张图片的质量是否足以识别出内容,以及发现了哪些质量缺陷。这些标签是我们作出以下贡献的重要基础:
(1)一个新问题和算法,决定是否一个图像识别的内容和质量不足识别,所以不是不能配上字幕,
(2)一个新问题和算法,决定一幅图像包含6个质量缺陷中的哪一个,
(3)一个新问题和算法,用于判断一个视觉问题是由于无法识别的内容而无法回答,还是因为感兴趣的内容在视野中缺失而无法回答,
(4)一个新的应用,更有效地创建一个大规模的图像字幕数据集,自动决定一幅图像的质量是否不够,因此不应该字幕
1. Introduction
1.1 针对特定的视觉任务,提出了一个IQA数据集
标签分类从无质量问题题到6种缺陷:模糊、过度曝光(明亮)、曝光不足(黑暗)、取景不当、障碍物和旋转视图
1.2 将这个新数据集用于以下三个方面:
(1) 引入了一个新的问题和算法来预测一幅图像是否有足够的质量来加上标题;
(2) 证明该预测系统的另一个好处是,通过很少的人力就能创建大规模图像字幕数据集;
(3) 引入了一个新的问题和算法,告诉用户提交一个新的视觉问题,这个问题是可以回答的,还是因为图像内容无法识别而不能回答,或者因为图像内容缺失而不能回答。
2. Related Work
2.1 Image Quality Datasets
由于与通过模拟高质量图像的失真而发现的图像质量问题相比,在真实环境中出现的图像质量问题表现出截然不同的特征,因此,本文创建大规模的数据集,标志质量问题的自然图像。本文不是专注于为每幅图像分配一个质量分数,以捕获各种图像质量问题中的任何一个,相反,其工作重点是认识到每个不同的质量问题的存在,并评估质量问题对实际用户的实际应用需求的影响。
2.2 Image Quality Assessment
提出了一种新的NR-IQA算法
2.3 Efficient Creation of Large-Scale Vision Datasets
引入了一个新的问题和算法,当图像内容无法被人类识别,因此应该被丢弃,并展示了这些解决方案的好处,更有效地创建一个大规模图像字幕数据集。
2.4 Assistive Technology for Blind Photographers
作为之前工作的补充,我们引入了一套新的AI问题和解决方案,当提醒blind peopple拍照者观察到什么图像质量问题时,可以提供更细粒度的指导。特别的,我们引入了新的问题,(1)识别图像内容是否被识别(并加上标题),(2)解释当有关图像的问题可以回答,但由于图像内容无法识别而无法回答,或者由于图像中缺少感兴趣的内容而无法回答时的问题.
3. VizWiz-QualityIssues
本节描述作者创建一个大规模的人工标记数据集,以支持算法的发展,可以评估图像的质量。