目录
前言
推进深度学习向前发展的三驾马车分别为:1. 数据集;2. 计算机的算力;3. 深度学习算法。然而,随着人工智能和深度学习算法在各个领域的应用取得显著的成效,对优质的数据集的要求越来越高,但现在主流的数据集仍然是关于纯计算机领域的应用,所以,选择好的数据集进行跨领域的迁移学习尝试也是计算机视觉(CV)领域常用的可行性方法。由于工程领域没有大范围公开的可用数据集,无法进行大面积的自主应用。
一、各类数据集简介
数据集种类来源(Openmmlab开源算法库):https://github.com/open-mmlab/mmsegmentation
1. Cityscapes数据集
Cityscapes即城市景观数据集,是现在语义分割领域常用的大规模数据集,其中包含一组不同的立体视频序列,记录在50个不同城市的街道场景。
城市景观数据集中针对城市街道场景的语义理解,该大型数据集包含来自50个不同城市的街道场景,还包含不同季节,背景以及同一天不同时间段的街景样式,除了20000个弱注释帧以外,还包含5000帧高质量像素级注释。因此,数据集的数量级要比以前的数据集大的多。Cityscapes数据集共有fine和coarse两套评测标准,前者提供5000张精细标注的图像,后者提供5000张精细标注外加20000张粗糙标注的图像。 Cityspaces官方网站:https://www.cityscapes-dataset.com/
2. PASCAL VOC数据集
PASCAL VOC(全称:The Pattern Analysis, Statical Modeling and Computational Learning Visual Object Classes)是一项由欧盟资助的世界级别计算机视觉挑战赛事,开始于2005年,现在已经停止举办,但是研究人员仍然可以在其服务器上提交预测结果来评估自己的模型性能。PASCAL VOC从举办开始,每年的内容都有所不同,从最开始的分类,到后面逐渐增加检测,图像分割,人体布局,动作识别(Object Classification 、Object Detection、Object Segmentation、Human Layout、Action Classification) 等内容,数据集的容量以及种类也在不断增加和改善。该项挑战赛催生出一大批优秀的计算机视觉模型(尤其是以深度学习技术为主的)。所以,对于该数据集的图片类型就比较多样化可能包含日常用品物体,猫狗动物以及风景照片等等。
PASCAL VOC数据集的可下载镜像网站:https://pjreddie.com/projects/pascal-voc-dataset-mirror/
3. ADE20K数据集
ADE20K数据集(全称:ADE20K Scene Parsing Challenge)是一个用于场景解析并覆盖了从室内到室外、自然到城市等各种不同的场景的大规模数据集,它包含了超过20,000个标注图像,用于图像语义分割任务。每个图像都经过了详细的标注,将图像中的每个像素进行了语义分类,共包含了150个不同的语义类别,如人、车辆、植物、建筑物等。该数据集旨在推动计算机视觉领域的研究和发展,特别是在场景理解和图像分割方面。可为各种应用提供支持,例如智能驾驶,图像编辑,数据增强等方面。
ADE20K官网: