【ARVR算法专栏】Google发布新的对象检测数据集:Objectron

Google发布的Objectron数据集包含大量3D注释视频,用于训练移动设备上的实时3D对象检测模型。数据集涵盖多种类别,具有相机姿势和AR元数据,推动计算机视觉在增强现实、机器人等领域的发展。同时,Google提供了基于该数据集训练的3D对象检测解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

仅通过在照片上训练模型,机器学习就已在许多计算机视觉任务中达到了不错的准确性,基于这些不断发展的如3D对象理解在增强现实,机器人技术,自主性和图像检索等广泛应用方面具有巨大潜力。例如,今年早些时候,Google发布了MediaPipe Objectron(一套针对移动设备设计的实时3D对象检测模型),它们在完全注释的真实3D数据集上进行了训练,可以预测对象的3D边界框。

Objectron数据集是一个精简的,以对象为中心的视频剪辑的集合,其中随附有AR  session元数据,其中包括相机姿势,稀疏点云以及周围环境中平面的特征。在每个视频中,相机都会在物体周围移动,从不同角度捕获物体。数据还包含每个对象的手动注释3D边界框,这些边界框描述了对象的位置,方向和尺寸。数据集包括15K带注释的视频剪辑,并补充了以下类别中的4M带注释的图像:bikes, books, bottles, cameras, cereal boxes, chairs, cups, laptops和shoes。此外,为了确保地理多样性,数据集来自五大洲的10个国家/地区。与数据集一起,Google还将共享3D对象检测解决方案用于四类物体:鞋子,椅子,杯子和照相机。这些模型是使用此数据集进行训练的,并在MediaPipe中发布。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值