Semi-Truths 是一个大规模的AI增强图像数据集,旨在评估和提升AI生成图像检测器的鲁棒性。该数据集包含了27,600张真实图像和1,472,700张通过多种增强技术生成的AI增强图像,这些图像覆盖了不同的扰动级别和数据分布。
Semi-Truths 的特点在于其详细的元数据,这些元数据描述了图像的来源、增强技术、变化幅度等,为研究者提供了标准化和针对性的评估工具。此外,数据集还包含了一个灵活的图像增强管道,支持无需人工指导的图像编辑,以及对新数据分布和图像合成技术的适应性。
现有的先进检测器对于不同类型的扰动、数据分布和增强方法表现出不同的敏感性,这为理解检测器的性能和局限性提供了新的视角。通过压力测试和定向语义编辑,Semi-Truths揭示了检测器在特定扰动下的表现,为改进检测器提供了有价值的见解。
技术解读
Semi-Truths 数据集是为评估AI生成图像