高级卷积神经网络学习指南
1. 图像多目标标注
在训练深度学习模型以检测多个对象时,需要比简单分类提供更多信息。对于每个对象,需通过标注过程同时提供分类和图像内的坐标,这与简单图像分类中的标记有所不同。
1.1 图像标记的挑战
即使在简单分类中,对数据集中的图像进行标记也是一项艰巨任务。给定一张图片,网络必须在训练和测试阶段提供正确分类,但不同人对图像的感知可能不同。例如,ImageNet 数据集的创建者使用了来自亚马逊 Mechanical Turk 众包平台的多个用户提供的分类。
1.2 边界框标注的复杂性
使用边界框标注图像时,同样依赖多人的工作。标注不仅要为图片中的每个对象标记类别,还要确定包围每个对象的最佳框。这两项任务使标注比标记更复杂,也更容易产生错误结果。正确进行标注需要更多人达成共识,以确保标注的准确性。
1.3 可用的开源标注工具
有一些开源软件可帮助进行图像检测(以及后续将讨论的图像分割)标注,以下是两个特别有效的工具:
- LabelImg :由 TzuTa Lin 创建(https://github.com/tzutalin/labelImg),教程见 https://www.youtube.com/watch?v=p0nR2YsCY_U。
- LabelMe :(https://github.com/wkentaro/labelme)是一个强大的图像分割工具,提供在线服务。
- FastAnnotationTool :基
超级会员免费看
订阅专栏 解锁全文
1426

被折叠的 条评论
为什么被折叠?



