定性语义图像分类与检索的心理物理评估
1. 引言
基于内容的图像分类和检索系统近年来变得愈发重要,已成为活跃的研究领域。随着对处理大量数字数据中动态复杂视觉内容的鲁棒、灵活技术的需求不断增加,对这些系统的研究也在不断深入。
大多数相关研究主要基于使用低级图像特征,如颜色、纹理、形状等。虽然低级图像处理算法和方法已相当成熟,但由于用户感知、理解与系统要求之间存在语义差距,新手很难有效地使用这类系统。此外,人类倾向于使用自然语言的语义关键词或概念来描述场景,例如“天空”“水”等,并以“有一片水在田野旁边且天空在顶部的图像”或“有一个小湖,后面是高山峰,左边是田野的图像”这样的方式指定检索需求。这表明,在定性表示语言中运用潜在的语义知识,或许能为建模人类语境提供一种途径,也是弥合语义差距、提升图像理解、分类和检索能力的自然方式。
此前,研究人员提出了一种基于图像局部语义内容的定性知识驱动框架,用于图像分类和检索。同时,为了评估该框架的效率和有效性,采用了心理物理评估方法。
1.1 定性分类与检索的基线方法
在计算机视觉、模式识别等领域,已经有大量工作致力于检测、识别和分类图像及其他应用领域中感兴趣的对象。大多数图像描述和分类技术基于使用颜色和纹理等低级特征,而语义场景描述被认为是描述图像特征的自然方式,可能有助于弥合人类描述与计算机描述之间的差距。尽管近年来在系统中使用语义内容以及在图像分析/自动标注中使用空间上下文和空间关系方面有了更多研究,但弥合低级合成特征与高级语义含义之间的语义差距仍是一个待解决的问题。
研究人员曾提出一种定性知识驱动的语义建模方法用于图像分类和检索。该方法展示了如何使用对一组局部语义概念(LSC)
超级会员免费看
订阅专栏 解锁全文
920

被折叠的 条评论
为什么被折叠?



