论文解读:NMF-KNN : Image Annotation using Weighted Multi-view Non-negative Matrix Factorization

本文提出了一种加权多视角非负矩阵分解(NMF-KNN)方法,用于解决图像标注中模型重训练和特征融合的问题。NMF-KNN通过一致性约束使所有特征的系数矩阵保持一致,解决特征融合,并使用权重矩阵处理数据不平衡,提高稀有标签的召回率。算法基于查询,适应图像数据库动态变化,实验证实在两个数据集上表现优秀。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要

现实中一个数据库中的图片是不断动态变化的,因此现有的图像标注方法有两个主要的缺点:一是加入新标签和新图像时,模型需要重新训练;二是需要对图像的多个特征进行专门的特征融合。本文提出一种加权的多视角非负矩阵分解方法来解决这两个问题。核心思想是利用提出的NMF-KNN算法在近邻图像集的特征和标签上学习基于查询的生成模型。NMF-KNN算法在不同特征的系数矩阵上加上一致性约束,这使得所有特征的系数矩阵保持一致,这自然而然地解决了特征融合的问题。而算法中引进的权重矩阵则消除了数据失衡的问题。最后,由于我们的算法是基于查询的,所以数据集中图像和标签的增加对我们的算法没有任何影响。实验表明我们的算法在两个数据集上均取得了有竞争力的效果。

1 简介

图像标注基于图像的视觉内容给图像附上文本标签。图像往往由多种不同的特征表达,如颜色等底层特征,物体等中层特征,或者类别等高层特征。但不同的特征表达同一幅图像,捕捉着相同的潜在结构。这使得转变每一图像的不同特征得到所有视角一致的新的表达成为可能。
最近邻图像标注算法基于查询进行图像标注,在图像数据库一直动态变化的情况下仍适用。受此启发,我们的方法也是一种最近邻图像标注算法。我们提出的方法的关键在于:把标签特征作为图像的一个新特征,加入到视角特征中;找到一种联合分解方法将所有视角分解为基矩阵和系数矩阵,且所有视角的系数矩阵具有一致性。这也迫使每个视角去找到同一潜在概念。分解完成后,目标图像的标签由其近邻图像的标签基矩阵和目标图像的视角特征的系数矩阵重构。
因此,给定一张目标图像,我们(1)首先提取其视觉特征并找到它的最近邻图像集合,(2)在所有视角上进行非负矩阵分解(包括视觉特征和标签特征)。由测试图像的视角特征和每个视角的基

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值