SSIM、PSNR、LPIPS 和 FID 是图像质量评估中常用的指标。它们衡量图像质量的方式不同,因此评价标准(越大越好还是越小越好)也不同。
图像质量评估指标及其评价标准
| 指标 | 全称 | 衡量侧重 | 评价标准 |
|---|---|---|---|
| SSIM | Structural Similarity Index (结构相似性指数) | 结构相似性:衡量两张图像在亮度、对比度和结构方面的相似性。它更符合人眼对图像质量的感知。 | 越大越好 (通常接近1):SSIM 值在 0 到 1 之间,1 表示两张图像完全相同。更高的 SSIM 值表示生成的图像与参考图像在结构上更相似。 |
| PSNR | Peak Signal-to-Noise Ratio (峰值信噪比) | 像素差异:衡量图像在像素层面上的失真程度,即信号(原始图像)与噪声(失真)之间的比率。是基于像素点误差的客观评估。 | 越大越好 (单位dB):PSNR 值以分贝(dB)表示,更高的 PSNR 值表示图像失真越小,质量越好。 |
| LPIPS | Learned Perceptual Image Patch Similarity (学习到的感知图像块相似性) | 感知相似性:使用深度学习模型提取的特征来衡量两张图像在感知(perceptual)层面的相似性。它试图模拟人眼对图像的“感觉”差异。 | 越小越好 (通常接近0):LPIPS 值越小表示生成的图像与参考图像在感知上越相似,即人眼看起来差异越小。 |
| FID | Fréchet Inception Distance (弗雷歇起始距离) | 分布相似性:衡量生成图像的特征分布与真实图像的特征分布之间的距离。它使用预训练的 Inception 模型提取图像特征,然后计算这两个特征分布的 Fréchet 距离。 | 越小越好 (通常接近0):FID 值越小表示生成图像的整体分布(包括多样性和真实感)越接近真实图像的分布,即生成质量越高。 |
总结
- 越大越好:SSIM 和 PSNR
- 越小越好:LPIPS 和 FID
在评估生成图像质量时,通常会综合考虑这些指标。例如,PSNR 关注像素级的准确性,SSIM 关注结构相似性,而 LPIPS 和 FID 则更关注生成图像的感知质量和多样性分布,这对于生成任务(如图像翻译)来说尤为重要。
1065

被折叠的 条评论
为什么被折叠?



