训练数据:理论、实践与挑战
1. 视频标注常见问题
在视频标注过程中,存在诸多常见问题。人类能够轻松识别场景中的元素,例如行驶道路上的路肩或植被位置,但仅从图像像素层面来看,却缺乏明显的可视证据。这实际上涉及到声明“应该”存在的事物与实际可见事物之间的差异。其他常见问题如下:
- 反射问题 :如窗户上的人影反射。
- 透明障碍物 :像栏杆这类虽构成障碍但具有透明性的物体。
- 物体形状预测差异 :物体检测通常预测为矩形,然而现实世界中的大多数物体并非矩形。
- 不可行驶区域的复杂场景 :例如拉斯维加斯大道这类繁忙且超出可行驶视野的区域。
- 视频帧中物体的出现与消失 :物体在视频帧中可能突然出现或消失。
2. 训练数据工作流
工作流是训练数据中技术与人员之间的纽带,它涵盖了人工任务、自动化流程以及数据流。商业工作流可以融入人工标注,以在完成日常工作的同时获得高质量的标注结果。人工任务是工作流的核心组成部分,任务需要模式(schema)、权限和数据流的支持。此外,审核循环和分析等步骤可确保标注质量。
标注错误的常见原因包括传感器或分辨率限制、欠佳的模式设计、不一致的指导说明以及复杂的空间类型。审核循环和其他工具能够减少错误,但与标注人员建立合作伙伴关系并赢得他们的信任往往能取得最佳效果。通常人们容易“指责标注人员”,但实际上改变整体数据结构(包括修改模式)可能更具成效。
模式的设计需要前期投入大量精力,
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



