PERIA-Framework:革新图像标注的半自动化解决方案
1. 图像标注技术概述
图像标注是将图像对象的语义概念转化为文本描述的过程。目前,主要的图像标注技术可分为自动和手动两类。
1.1 自动图像标注
自动图像标注技术主要利用机器学习方法,通过提取图像的低层次描述符(如颜色、纹理、边缘、形状等),并使用分类器(如神经网络、决策树、朴素贝叶斯分类器)进行训练和标注。常见的自动图像标注工具包括交互式图像标注系统(I2A)、基于多元高斯模型的新图像自动标注方法(MAGMA)、层次化自动图像标注系统(HANOLISTIC)和语义图像标注与检索系统(SIA)等。然而,自动图像标注技术存在一些局限性,如通常只考虑单一描述符类型和分类器,限制了概念和描述符的多样性,且难以进行同义词扩展和人工修订,也不支持分类器的微调。
1.2 手动图像标注
手动图像标注依靠领域专家的认知能力,对图像中的概念进行感知和解释,并以精确的单字文本描述进行标注。像Flickr、Facebook、YouTube等社交媒体应用,以及Combinformation、PhotoStuff、LabelMe、DoctorEye和体积对象图像标注系统(VANO)等工具,都提供了手动图像标注功能。手动标注虽然能提高准确性,但对于大量图像对象的标注工作来说,效率低下,且容易受到标注者主观因素的影响,存在可扩展性问题。
1.3 现有技术的问题与动机
自动图像标注方法因严格关联预定义的描述符和概念,导致过程存在偏差,且分类器限制了标注的多样性。手动图像标注则受标注者视觉感知和思维过程的影响,存在主观性偏差,并且难以处理大量图像的标注任务。因
超级会员免费看
订阅专栏 解锁全文
5

被折叠的 条评论
为什么被折叠?



