Perceptual Quality Assessment of Smartphone Photography(论文笔记)
论文笔记
论文地址:Perceptual Quality Assessment of Smartphone Photography
源码地址:https://github.com/h4nwei/SPAQ
1. Contributions
- 提出了一个大型图数据库SPAQ,包含11125张真实照片。为了便于在不同的相机之间进行比较,SPAQ中1000张照片中的一个子集被不同的智能手机在相同的视觉场景下拍摄。每张图片都有EXIF数据,这些数据提供了被捕捉场景的有用信息(如时间和亮度)和相机设置(如ISO和f-number)。
- 收集了每幅图像的平均意见分数(MOS)并验证其可靠性。此外,每个图像都标注了五个与感知质量[9]密切相关的图像属性,还根据内容信息将图像分类为9个场景类别,以便于首次探索感知质量和高级语义之间的交互作用。
- 基于主观数据,深入分析了EXIF标签、图像属性、场景类别标签与图像质量的关系。并且对不同智能手机的摄像头进行比较和排名。
- 使用SPAQ训练由基线和多任务深度神经网络构建的盲图像质量评估(BIQA)模型。第一次从计算的角度研究EXIF标签、图像属性和场景标签是如何影响质量预测的。更重要的是,研究结果揭示了如何为智能手机创建更好的摄影系统。
2. SPAQ Databse
2.1 Database Construction
SPAQ中的每张图像都包括:
(1) EXIF标签,包括1)焦距,2)f值(与孔径大小成反比),3)曝光时间,4)ISO(传感器的光敏度),5)亮度值(场景中焦点的亮度),6)flash (flash是否触发),7)时间(记录图像时)。
(2) MOS,表示图像整体质量的连续分值[0,100]。分数越高表示感知质量越好。
(3) 图像属性分数,包括1)亮度,2)色彩,3)对比度,4)噪声,5)锐度。与MOS类似,每个属性都用一个连续的分数来表示[0,100]
(4) 场景类别标签,包括1)动物,2)城市,3)人,4)室内,5)景观,6)夜景,7),植物,8)静物,9)其他,见图1。静物是指包含明显静态物体