abstract
由于先进生成模型可以生成逼真的图像,加剧了对虚假信息宣传的担忧。但是,当前没有最先进图像生成器生成的大量图片的数据集,成为了这类检测器发展的一个障碍。
本文介绍了GenImage数据集有以下几个优点:
- 大量数据,有一百万对
- 内容丰富,有大量类别
- 由最先进的GAN和Diffusion模型生成
文章还对数据集进行了全面分析,并提出了两个评估检测方法的任务,模拟真实世界场景:
- 跨生成器图像分类任务:测量一个生成器上训练的检测器,在别的生成器上的测试性能
- 降级图像分类任务:评估检测器在处理如低分辨率,模糊和压缩图像等降级图像的能力
Dataset Construction
Fake Image Generators
- Diffusion Model:midjourney Wukong Stable Diffusion ADM GLIDE VQDM
- GAN model:在过去的几十年中,为图像生成带来了显着的质量改进。BigGAN
GenImage Benchmark
Fake Image Detectors
- backbone model:直接使用ResNet-50,DeiT-S ,Swin-T来做检测器,没有特别的设计
- Fake Face Detector:F3Net和GramNet,都是用于检测虚假人脸的
F3Net同时探索频率分量的划分和频率统计分布 GramNet考虑全局纹理特征
- General Fake Image Detector:Spec:在真实图片中添加由GAN生成的伪造特征。
Task 1: Cross-Generator Image Classification
检测某一生成模型的生成图像很简单。目标是做一个能够独立于使用的生成器区分真实和虚假图像的

最低0.47元/天 解锁文章
6641

被折叠的 条评论
为什么被折叠?



