文章目录
cleanfid库的fid使用,及其使用CLIP模型clip_vit_b_32计算FID
本博客简介
这篇博客详细介绍了如何使用 cleanfid 库计算 Fréchet Inception Distance (FID),特别是利用 CLIP 模型 clip_vit_b_32 计算 FID 分数来评估生成图像的质量。内容涵盖了 FID 的概念和原理、cleanfid 库的安装与配置、从缓存中加载与手动加载模型的方法,以及解决可能遇到的依赖问题。通过这篇教程,可以掌握使用 cleanfid 库计算fid的完整流程,并能够解决服务器环境中遇到的联网与模型下载问题。
1. FID简介
FID(Fréchet Inception Distance)是一种用于衡量生成图像质量的评估指标,特别常用于生成对抗网络(GAN)和其他生成模型的效果评估。FID 通过量化生成图像和真实图像之间的差异来衡量生成图像的“真实感”。

图来自:https://github.com/GaParmar/clean-fid?tab=readme-ov-file
原理概述
FID 的计算方法主要包括以下步骤:
-
特征提取:首先,将真实图像和生成图像通过一个预训练的图像识别网络(如 Inception V3)提取特征,这些特征通常是图像中间层的激活值。这些激活值可以被看作是图像的特征向量。
-
高斯分布假设:对于真实图像和生成图像的特征向量集合,分别计算它们的均值和协方差矩阵,假设它们符合多维高斯分布。
-
Fréchet 距离计算:将两个高斯分布之间的距离(即 Fréchet 距离)作为真实图像分布和生成图像分布之间的差异度量。Fréchet 距离计算公式如下:
FID = ∣ ∣ μ 1 − μ 2 ∣ ∣ 2 + Tr ( Σ 1 + Σ 2 − 2 ( Σ 1 Σ 2 ) 1 / 2 ) \text{FID} = ||\mu_1 - \mu_2||^2 + \text{Tr}(\Sigma_1 + \Sigma_2 - 2(\Sigma_1 \Sigma_2)^{1/2}) FID=∣∣μ1−μ2∣∣2+Tr(Σ1+Σ2−2(Σ1Σ2

最低0.47元/天 解锁文章
1151





