27、基于非抽象视觉关键词的语义自动图像标注

基于非抽象视觉关键词的语义自动图像标注

1. 引言

自动图像标注旨在根据图像的视觉内容自动生成文本标签,这种基于内容的自动图像标注方法能在视觉内容和标注之间建立良好的联系。然而,现有的基于内容的自动图像标注模型大多存在一个问题,即没有考虑对应关键词的视觉表示,导致最终标注结果中出现大量不相关的标注。为解决这一问题,提出了一种基于相关视觉关键词的新自动图像标注模型(NAVK)。

2. 相关工作
  • Machine Translation Model :Duygulu等人将图像标注视为两种语言之间的翻译问题,一种是图像内容的视觉词汇,另一种是真实的文本词汇。他们使用归一化切割对图像进行分割,然后用K - Means算法对这些区域进行聚类,图像标注可看作从视觉词汇块到语义关键词的翻译过程。
  • Cross Media Relevance Model (CMRM) :Jeon等人使用语义标签和视觉单词的联合概率来标注图像,但使用与翻译模型相同的离散特征,不可避免地会丢失一些有用的视觉信息。
  • Continuous Relevance Model (CRM) :Lavrenko等人直接利用图像区域的连续特征,并使用非参数高斯核连续估计视觉内容的生成概率。
  • Multiple Bernoulli Relevance Model (MBRM) :Feng等人使用矩形网格代替复杂的分割算法来划分图像,并应用伯努利分布代替多项分布来描述词汇的生成分布。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值