高级卷积神经网络学习与应用
1. 图像多目标标注
在训练深度学习模型以检测多个对象时,需要比简单分类提供更多信息。对于每个对象,通过标注过程提供分类和图像内的坐标,这与简单图像分类中的标记不同。
在简单分类中,标注数据集中的图像就是一项艰巨任务。给定一张图片,网络必须在训练和测试阶段提供正确的分类。在标记时,网络为每张图片确定正确的标签,但并非每个人对所描绘图像的理解都相同。例如 ImageNet 数据集的创建者就采用了来自 Amazon Mechanical Turk 众包平台的多个用户提供的分类。
使用边界框标注图像时,同样依赖多人的工作。标注不仅要为图片中的每个对象标记,还要确定包围每个对象的最佳框。这两项任务使标注比标记更复杂,也更容易产生错误结果。正确进行标注需要更多人达成共识,以确保标注的准确性。
有一些开源软件可帮助进行图像检测(以及后续将讨论的图像分割)的标注,以下是两个特别有效的工具:
- LabelImg :由 TzuTa Lin 创建(https://github.com/tzutalin/labelImg ),教程见 https://www.youtube.com/watch?v=p0nR2YsCY_U 。
- LabelMe :(https://github.com/wkentaro/labelme )是一个强大的图像分割工具,提供在线服务。
- FastAnnotationTool :基于计算机视觉库 OpenCV(https://github.com/christopher5106/Fas
超级会员免费看
订阅专栏 解锁全文
1214

被折叠的 条评论
为什么被折叠?



