作者丨张立石、付程晗、李甲
学校丨北京航空航天大学
研究方向丨计算机视觉
介绍
本文概述了被 2018 年 10 月 ACM Multimedia 会议录用为 Oral 的论文:Collaborative Annotation of Semantic Objects in Images with Multi-granularity Supervisions。在此论文中,北京航空航天大学硕士研究生张立石、付程晗及其导师李甲,提出了一种基于多粒度监督的图像语义物体协同标注的方法,实现了在几乎不影响标注精确度的前提下,减少了人工标注的时间。
■ 论文 | Collaborative Annotation of Semantic Objects in Images with Multi-granularity Supervisions
■ 链接 | https://www.paperweekly.site/papers/2218
■ 源码 | http://dwz.cn/kltHyMz0
■ 主页 | http://cvteam.net/
背景
在过去 10 年,大规模图像数据集大大推动了计算机视觉技术的发展。这些数据集中的图片被一个或多个标签标注,用于描绘图片中主要对象的语义类别。在最新的应用,比如自动驾驶,机器人导航,视觉问题回答等,仅有图像级标签是不够的,这些应用需要像素级的语义对象:图像中的对象是什么、在哪里。
计算机视觉领域对像素级标注语义对象的需求越来越强烈,但是像素级的标注是冗余乏味的,需要耗费大量的人力资源。因此,为了将现有图像级标签的数据集转化为像素级标注的数据集,在标注精确度不受影响的前提下,减少人工标注时间是很有必要的。
机器和人协同标注的方法已经被研究多年,基于协同策略,现有的方法被分为两类:Agent-decision 和 Human-decision。
Agent-decision 就是首先标注者进行粗略的标注,然后机器进行自动修正。这些标注结果很少作为 ground-truth。
Human-dec