基于信息推理的上下文敏感标签扩展
1. 引言
随着各类标签系统的迅速普及,标签在众多领域占据了重要地位。以图像标签为例,它是基于文本的图像导航和搜索系统的关键,图像检索引擎的性能在很大程度上与图像标签的准确性相关。然而,手动为图像添加标签非常耗时,Flickr的研究表明,尽管用户通常愿意提供标签,但大多数图像只有1 - 3个用户标注的标签。因此,自动图像标签扩展成为了近期的一个基础研究课题。
目前,大多数语义图像标签扩展方法采用关联规则或潜在狄利克雷分配(LDA)等技术来挖掘图像标签。这些方法主要依赖标签的共现关系来推导新标签,这限制了扩展标签的范围,可能会丢失一些低共现频率但存在强关联的标签关系。
为解决这一问题,本文提出了一种上下文敏感的标签扩展方法,通过构建信息推理模型来实现。该方法分为离线标签挖掘和在线标签扩展两个主要部分。离线过程中,在图像标签上构建未加权的超空间语言类比(HAL)模型;在线处理时,对于带有少量种子标签的图像,将这些种子标签的概念组合以高维HAL向量的形式计算,然后根据共现关系、逆向量频率和上下文相似度三个因素计算组合概念与数据集中每个单词的相关性,最后选取最相关的前K个单词作为目标图像的扩展标签。这种方法的优势在于能够生成与目标图像相关但与现有标签共现频率可能较低的额外标签。
2. 相关工作
2.1 图像标签扩展
图像标签扩展是根据图像的一个或多个现有标签,按照前导标签挖掘过程生成的扩展规则自动扩展额外描述性标签的过程。这些扩展标签可作为个性化标签推荐给标签系统的用户,或作为集体标签推荐用于提高基于标签的图像检索效率。
标签挖掘可以基于语义相似度、视觉相似度或两者结
超级会员免费看
订阅专栏 解锁全文
1030

被折叠的 条评论
为什么被折叠?



