谷歌公开最大分割掩码数据集Open Images V5,同时开启挑战赛
在这篇文章中:
- Open Images V5
- 2019 Open Images挑战赛
谷歌公开了Open Images V5,它将分割掩码添加到注释中,同时宣布了第二个Open Images挑战赛,将基于该数据提供一个新的实例分割赛道。
2016年,谷歌推出了Open Images,约900万张图像的协作版本,注释了数千个对象类别的标签。到了2018年,已更新到了Open Images V4,该版本总共包含了1540万个用于600个对象类别的边界框,使其成为拥有对象位置注释和30万多个可视关系注释的最大数据集。
Open Images V5
新的V5版本涵盖350个类别,具有280万个对象实例的分割掩码。
与仅识别对象所在区域的边界框不同,分割掩模标记对象的轮廓,将其空间范围表征为更高级别的细节。
谷歌确保不同物体之间的一致性注释,例如,所有猫的掩码都包括尾巴,由骆驼携带的袋子也都会包含在掩码中。重要的是,这些掩码涵盖了更广泛的对象类别和比以前任何数据集更大的实例总数。
以下是Open Images V5训练集上的一些示例掩码。这些是由交互式细分过程产生的。第一个示例还显示了一个边界框,用于比较:
该训练集的分割掩码由最先进的生产交互式分割过程产生,其中专业人工注释反复纠正分割神经网络的输