简介
CelebA-Spoof是一个大规模人脸防欺骗数据集,该数据集包含来自10,177个受试者的625,537张图像,包括人脸、光照、环境和欺骗类型等43个丰富的属性。有40个属性属于Live图像,包括皮肤、鼻子、眼睛、眉毛、嘴唇、头发、帽子、眼镜等所有面部成分和配件。3个属性属于恶搞图像,包括恶搞类型、环境和光照条件。如果要做人脸的活体检测,这个数据库是一个不错的选择。
下载地址有两个:
百度云:百度云下载(password: 61fd)
Google Drive:Google云盘
一、数据集准备与解压
CelebA_Spoof数据集有70多G,建议没有开会员的同学可以从Google Drive下载,下载好的文件是分批压缩的。共有74个压缩文件。

1. 数据集解压
数据集以压缩包形式提供, 7-Zip 分批解压所有编号为 001 到 074 的 zip 文件(见上图),需要提前安装 7-Zip,安装后用下面的步骤进行解压:
Windows:按下 Win + R,输入 cmd,然后按回车。
Linux/Mac:打开终端。
使用 cd 命令导航到存放 zip 文件的文件夹。
cd path\to\your\zipfiles
对于 Windows(命令提示符):
运行以下命令:
for %i in (*.zip.*) do "C:\Program Files\7-Zip\7z.exe" x "%i" -o"output_folder" -y
如果 7-Zip 安装在其他路径,请将 C:\Program Files\7-Zip\7z.exe 替换为实际路径。
将 output_folder 替换为你希望解压文件存放的目标文件夹名称。
参数 -y 表示自动回答“是”以跳过提示。
对于 Linux/Mac(终端):
for file in *.zip.*; do 7z x "$file" -ooutput_folder -y; done
将 output_folder 替换为目标文件夹名称。
解压后目录结构如下:
CelebA_Spoof/
├── Data/
│ ├── train/
│ │ ├── ID/
│ │ │ ├── live/ # 真实人脸图像
│ │ │ │ ├──xxx.png #原图
│ │ │ │ └──xxx_BB.txt #原图对应的人脸坐标与分数
│ │ │ └── spoof/ # 欺骗攻击图像
│ │ │ │ ├──xxx.png #原图
│ │ │ │ └──xxx_BB.txt #原图对应的人脸坐标与分数
├── metas/
│ ├── intra_test/ #内部数据集基准,包含数据描述和 JSON 标签文件。
│ └── protocol1/ #包括训练/测试划分和 JSON 标签文件。
│ └── protocol2/ #包括不同设备质量(高、中、低)下的训练/测试划分和 JSON 标签文件。
├── README
二、数据处理与标注解析
值得注意的是,CelebA-Spoof 数据集不仅提供了活体/伪造(Live/Spoof)的标注,还进一步对伪造类型、光照条件和环境进行了详细的标注。这些丰富的注解有助于从多个角度全面研究面部反欺骗任务。提供的json标签文件中,包含了40中人脸属性(继承自CelebA数据集,涵盖了如性别、年龄、表情等多种属性)和3中与活体/反欺骗相关的属性:
伪造类型(Spoof Type):定义了不同类型的伪造攻击。
光照条件(Illumination Condition):描述了图像拍摄时的光照情况。
环境(Environment):指出了图像拍摄的环境。
比如下面这两张图片以及对应的标签:
"Data/test/5284/live/494568.png": [
[0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0], # [0:39]: 人脸属性标签
0, # [40]: 伪造类型标签(Spoof Type) -> Live(活体)
0, # [41]: 光照条件标签(Illumination Condition) -> Live(活体)
0, # [42]: 环境标签(Environment) -> Live(活体)
0 # [43]: 活体/伪造标签 -> Live(活体)
]
"Data/test/6336/spoof/494419.png": [
[0, 0, 0,

最低0.47元/天 解锁文章
946

被折叠的 条评论
为什么被折叠?



