利用WordNet改进图像标注
在图像标注领域,如何准确地为图像添加合适的关键词一直是一个重要的研究方向。本文将介绍一些用于图像标注的方法,包括关键词与图像特征的关联计算、自动标注、语义相似度测量以及相关实验结果等内容。
1. 关键词与图像特征的关联计算方法
在计算关键词与图像特征的关联时,有两种常用的方法:
- 相关方法(CRM) :使用 $M_TW × M_B$ 得到一个维度为 $W × B$ 的矩阵,然后对每一列进行归一化,得到基于共现的概率表 $T_{corr}$。$T_{corr}[i, j]$ 是 $p(w_i|b_j)$ 的估计值,即给定图像块 $b_j$ 时关键词 $w_i$ 的条件概率。
- 余弦方法(CSM) :不使用 $M_TW × M_B$,而是应用余弦来计算维度为 $W × B$ 的矩阵,其中第 $i$ 行第 $j$ 列的元素是 $M_TW$ 中第 $i$ 列和 $M_B$ 中第 $j$ 列之间的余弦值。然后,与 CRM 相同,对每一列进行归一化以得到概率表 $T_{corr}$。
2. 自动标注
为了自动标注图像,需要计算给定图像对象与所有图像块标记的质心之间的距离,并使用最接近的图像块标记的关键词来表示该图像对象。图像的标注是使用分配给图像中所有对象的关键词生成的。
3. 语义相似度测量
语义相似度测量的目的是从翻译模型生成的标注关键词中去除图像的噪声关键词,同时保留相关关键词。具体步骤如下:
1. 从图像的标注关键词中找到相关概念。
2. 测量这些概念之间的相似度。
超级会员免费看
订阅专栏 解锁全文
14

被折叠的 条评论
为什么被折叠?



