计算机视觉数据集制作的技巧（给小白）

最新推荐文章于 2024-05-02 15:44:37 发布

原创

最新推荐文章于 2024-05-02 15:44:37 发布 · 1.4k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#神经网络 #pytorch

前言：

目标检测是计算机视觉一个重要的领域。物体检测（object detection）是计算机视觉中一个重要的分支，其大致功能是识别一组预定义的对象类，比如说人、汽车、自行车、动物。

并使用边界框（矩形框/bounding box）描述图像中每个检测到的图像位置。

通常我们会使用最小边界框（矩形框/bounding box）框出目标物体位置，并进行分类。

但是通常对象的形状往往是不规则的，所以另一种代替的方法是图像分割技术，图像分割技术一般会精确到像素级。（后话）

为了有效地给图片贴上标签，下面的文章介绍了一些策略，以确保你的数据集尽可能是高质量的。

虽然下面的最佳实践通常是正确的，但重要的是要注意，标签说明高度依赖于手头任务的性质。

此外，为一项任务标记的图像。可能不适合另一项任务——为了防止重新标记，我们应该考虑到这一点，下面让我们演练一些技巧。

不确定首先要标记哪些图像？考虑如何在计算机视觉中使用主动学习。

最好把数据集及其标签看作是有生命的东西:不断地改变和改进，以适应手头的任务。

1. 在每张图片上标记每一个感兴趣的物体

计算机视觉模型的建立是为了，了解像素的哪些图案，对应一个感兴趣的对象。

正因为如此，如果我们训练一个模型，来识别一个对象，我们需要在我们的图像中，标记该对象的每一个外观。

如果我们在一些图像中，不给对象贴上标签，我们将会给我们的模型，引入错误的数据。

例如，在国际象棋棋子数据集中，我们需要标记棋盘上每个棋子的外观，我们不仅仅会标注其中的一部分，我们会给标记的对象添加一个名字比如说是白色的棋子。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

高高呀~ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。