人脸与人体相关数据集

最新推荐文章于 2025-10-23 10:50:58 发布

原创最新推荐文章于 2025-10-23 10:50:58 发布 · 置顶 · 1.6k 阅读

7 ·

CC 4.0 BY-SA版权

Machine Learning 专栏收录该内容

24 篇文章

订阅专栏

IMDB-WIKI：包含IMDb中20k+个名人的460k+张图片和维基百科62k+张图片，总共523k+张图片

Adience：包含2k+个人的26k+张人脸图像。人脸性别，人脸年龄段

CACD2000：2k名人160k张人脸图片。人脸年龄

人脸检测数据集：

http://vis-www.cs.umass.edu/fddb/#explore

wider face: http://shuoyang1213.me/WIDERFACE/

FDDB：2845张图片中的5171张脸。标准人脸检测评测集

Caltech10 web faces：10k+人脸，提供双眼和嘴巴的坐标位置。人脸点检测

行人重识别（ReID）数据集：

CUHK03：1360persons 13164 b-boxes

Market1501：1501persons 32643 b-boxes

DukeMTMC-ReID：1812persons 36441 b-boxes

MSMT17：4101persons 126411 b-boxes

数据集（序列）：

LPW：2700+persons 59w+b-boxes 7694tricklets

MARS：1261persons 119wb-boxes 2w+tricklets

LVReID：3772persons 300wb-boxes 1.5wtricklets

人脸识别：

https://www.robots.ox.ac.uk/~vgg/data/vgg_face2/data_infor.html

http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html

CelebFaces属性数据集（CelebA）是一个大规模的面部属性数据集，其中包含200,000多个名人图像，每个图像都有40个属性注释。该数据集中的图像涵盖了较大的姿势变化和背景杂波。 CelebA具有多种多样，数量众多且注释丰富的特点，包括

10,177 number of identities,
202,599 number of face images, and
5 landmark locations, 40 binary attributes annotations per image.

该数据集可用作以下计算机视觉任务的训练和测试集：面部属性识别，面部检测，界标（或面部部分）定位以及面部编辑和合成

WebFace：10k+人，约500k张图片。非限制场景

FaceScrub：530人，约100k张图片。非限制场景

YouTube Face：1595人，3425段视频。非限制场景

LFW：5k+人脸，超过10K张图片。标准的人脸识别数据集

MultiPIE：337个人的不同姿态、表情、光照的人脸图像，共750k+人脸图像。限制场景人脸识别

MegaFace：690k不同的人的1000k人脸图像。新的人脸识别评测集合

CAS-PEAL：1040个人的30k+张人脸图像，主要包括姿态、表情、光照变化。限制场景下人脸识别

Pubfig：200个人的58k+人脸图像。非限制场景下识别

人脸表情：

CK+：137个人的不同人脸表情视频帧。正面人脸表情识别

带口罩的人脸数据集：

lfw 链接: https://pan.baidu.com/s/1hgNjbAgY74alYl4zbCMCoQ 提取码: urqy

链接: https://pan.baidu.com/s/1nxTzWl2Xb_-0D0Qs0-bRbw 提取码: g5kg

webface 链接: https://pan.baidu.com/s/18fHQ100KUsejTQTOB-MlHQ 提取码: ptaj

分类数据集：

GHIM-10k：http://www.ci.gxnu.edu.cn/cbir/Dataset.aspx

是一个图像检索数据集，包含20个类别的自然图像。各类别拥有较好的多样性，而类别之间也有比较好的区分度。

该数据集共1w幅图像，每个类别包含500幅JPEG格式的大小为400x300或300x400的图像。

Place20：http://places2.csail.mit.edu/download.html

视频数据集：

UFC101：https://www.crcv.ucf.edu/data/UCF101.php

包括13320个短视频，共101个类别，其中主要包含5类动作：人与物体互动、人体动作、人与人互动、乐器演奏和体育运动。每类由25个人来做规定的动作，每个人做4-7组，视频的大小为320x240。

HMDB51：https://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/

1M sport：http://www.precision-sport.com/shop-by-make/bmw/e82-2008---present/1-series-m-coup

人体姿态识别数据集：

Human3.6M (2014)

3D姿态估计最大、最广泛使用的数据集
360万张图像，4个不同的视角 (原数据集提供的是视频，50fps)
15个动作: directions, discussion, eating, greeting, phoning, posing, purchases, sitting, sitting down, smoking, taking photo, waiting, walking, walking dog, walking together
11 个人，但只有7个人包含3D姿态标签
- 训练: S1, S5, S6, S7, S8 (1559752张图像)
- 测试: S9, S11 (550644张图像)
备注：实际使用的时候只用了7个人的数据，总共210万张图像，所以我感觉应该称为Human2.1M。而且从原数据的视频中提取出图片的时候，提取出的图片数会比标签要多，提取出来有2137070张图像，而标签只有2110396个。在使用这个数据集的时候将每个视频舍弃尾部几帧多出来的图像使得与标签一一对应。

HumanEva(2010)

MPI-INF-3DHP (2017)