通用计算机视觉数据集
-
CelebA
- 内容:大规模人脸属性数据集,包含超过20万张名人图像,每张图像有40多种属性标注(如性别、年龄、发型等)。
- 用途:人脸识别、属性分析、生成模型(如GANs)。
-
CIFAR-100
- 内容:包含100个类别的6万张32x32小图像,每个类别600张(500训练+100测试)。
- 用途:图像分类、小样本学习。
-
COCO2017
- 内容:微软发布的通用图像数据集,包含目标检测、分割、关键点标注等。
- 用途:目标检测、实例分割、图像描述生成。
-
ImageNet & ImageNet100
- 内容:ImageNet包含1400万张图像,覆盖2万多个类别;ImageNet100是其子集(100个类别)。
- 用途:图像分类、预训练模型(如ResNet、ViT)。
-
DIV2K
- 内容:高清图像数据集(2K分辨率),用于超分辨率重建任务。
- 用途:图像超分、画质增强。
-
MVTec Anomaly Detection
- 内容:工业异常检测数据集,包含正常和缺陷样本(如PCB、纺织品)。
- 用途:缺陷检测、异常定位。
自动驾驶与场景理解
-
Cityscapes
- 内容:城市街道场景数据集,包含像素级语义分割标注。
- 用途:语义分割、自动驾驶感知。
-
KITTI Object & KITTI Depth Completion
- 内容:KITTI数据集包含激光雷达、相机数据,涵盖目标检测、深度补全等任务。
- 用途:3D目标检测、深度估计、SLAM。
-
nuScenes
- 内容:多模态自动驾驶数据集(雷达、摄像头、LiDAR),覆盖复杂场景。
- 用途:3D检测、路径规划。
-
Waymo Open Dataset
- 内容:谷歌Waymo发布的自动驾驶数据,包含长序列多传感器数据。
- 用途:运动预测、行为分析。
-
CULane
- 内容:车道线检测数据集,覆盖多种天气和光照条件。
- 用途:车道检测、自动驾驶导航。
自然语言处理(NLP)
-
AISHELL
- 内容:中文语音识别数据集,包含400小时录音及文本转录。
- 用途:语音识别、声学模型训练。
-
BERT-Pretrain-Model
- 内容:预训练的BERT模型及相关语料(可能基于中文或英文)。
- 用途:文本分类、问答系统。
其他专用数据集
- CASIAWebFace:人脸识别数据集,包含1万人的50万张图像。
- CUB200-2011:鸟类细粒度分类数据集,200种鸟类,每类约60张图像。
- DOTA:遥感图像目标检测数据集,包含飞机、船舶等标注。
- GOT10k:通用物体跟踪数据集,用于视频目标跟踪。
- VOCdevkit:Pascal VOC数据集,经典的目标检测/分割数据集。
备注
- ADEChallengeData2016:场景解析数据集(MIT发布),包含室内外场景分割标注。