摘要
现实中一个数据库中的图片是不断动态变化的,因此现有的图像标注方法有两个主要的缺点:一是加入新标签和新图像时,模型需要重新训练;二是需要对图像的多个特征进行专门的特征融合。本文提出一种加权的多视角非负矩阵分解方法来解决这两个问题。核心思想是利用提出的NMF-KNN算法在近邻图像集的特征和标签上学习基于查询的生成模型。NMF-KNN算法在不同特征的系数矩阵上加上一致性约束,这使得所有特征的系数矩阵保持一致,这自然而然地解决了特征融合的问题。而算法中引进的权重矩阵则消除了数据失衡的问题。最后,由于我们的算法是基于查询的,所以数据集中图像和标签的增加对我们的算法没有任何影响。实验表明我们的算法在两个数据集上均取得了有竞争力的效果。
1 简介
图像标注基于图像的视觉内容给图像附上文本标签。图像往往由多种不同的特征表达,如颜色等底层特征,物体等中层特征,或者类别等高层特征。但不同的特征表达同一幅图像,捕捉着相同的潜在结构。这使得转变每一图像的不同特征得到所有视角一致的新的表达成为可能。
最近邻图像标注算法基于查询进行图像标注,在图像数据库一直动态变化的情况下仍适用。受此启发,我们的方法也是一种最近邻图像标注算法。我们提出的方法的关键在于:把标签特征作为图像的一个新特征,加入到视角特征中;找到一种联合分解方法将所有视角分解为基矩阵和系数矩阵,且所有视角的系数矩阵具有一致性。这也迫使每个视角去找到同一潜在概念。分解完成后,目标图像的标签由其近邻图像的标签基矩阵和目标图像的视角特征的系数矩阵重构。
因此,给定一张目标图像,我们(1)首先提取其视觉特征并找到它的最近邻图像集合,(2)在所有视角上进行非负矩阵分解(包括视觉特征和标签特征)。由测试图像的视角特征和每个视角的基