1. 摘要
- 构建用于深度学习目标检测的综合图像数据集对建筑业意义重大,但创建难度大。本文开发并公开了名为 Site Object Detection Dataset (SODA) 的大规模建筑工地图像数据集,包含 15 个物体类别,从多个工地不同场景收集超 20,000 张图像。统计分析显示其多样性和规模良好,用两种深度学习目标检测算法评估,最高平均精度均值(mAP)达 81.47%,为建筑业提供了数据集并建立了算法评估基准。
图 1:展示从 SODA 数据集中选取的示例图像,呈现了建筑工地场景下不同类别的物体,如工人、材料、机器和布局相关物体,让读者直观感受数据集图像内容。
2. 研究背景
- 建筑业现状与需求:建筑业仍依赖人工判断管理,效率低。计算机视觉技术发展使自动化管理成为可能,基于深度学习的目标检测引入建筑管理是新方向,但需要定制图像数据集。
- 现有数据集问题:现有建筑工地图像数据集规模小、类别少。构建综合数据集面临图像采集和标注难题,如场地封闭、采集角度受限、环境复杂等。
图 2:标注标准示