高级卷积神经网络学习与应用
1. 图像多目标标注
在训练深度学习模型以检测多个对象时,所需的信息比简单分类更多。对于每个对象,需要通过标注过程提供分类和图像内的坐标,这与简单图像分类中的标记有所不同。
1.1 图像标注的挑战
即使是简单的图像分类,标注数据集也是一项艰巨的任务。给定一张图片,网络在训练和测试阶段都必须给出正确的分类。在标记过程中,网络要为每张图片确定正确的标签,但不同人对图像的理解可能不同。例如,ImageNet数据集的创建者借助了亚马逊Mechanical Turk众包平台上多个用户提供的分类信息。
1.2 边界框标注
使用边界框标注图像时,同样需要依靠多人的工作。标注不仅要为图片中的每个对象贴上标签,还要确定包围每个对象的最佳框。这两项任务使得标注比标记更加复杂,也更容易产生错误结果。正确的标注需要更多人的参与,以达成对标注准确性的共识。
1.3 开源标注工具
有一些开源软件可用于图像检测标注(以及后续章节将讨论的图像分割),以下是一些特别有效的工具:
- LabelImg :由TzuTa Lin创建(https://github.com/tzutalin/labelImg ),教程见https://www.youtube.com/watch?v=p0nR2YsCY_U 。
- LabelMe :(https://github.com/wkentaro/labelme )是一个强大的图像分割工具,提供在线服务。
- FastAnnotationTo
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



