31、超越词袋模型的概念检测与大规模图像检索

超越词袋模型的概念检测与大规模图像检索

在当今的计算机视觉领域,图像检索和概念检测是非常重要的任务。传统的词袋模型(BoW)在处理这些任务时存在一定的局限性,因此研究人员一直在探索更有效的方法。本文将介绍两种相关的研究,一种是超越词袋模型的概念检测方法,另一种是使用局部聚合描述符向量(VLAD)进行大规模图像检索的方法。

超越词袋模型的概念检测
1. 数据集描述

研究人员在两个不同的数据集上进行了实验:
- 圣经数据集 :该数据集来自1450年至1471年意大利费拉拉公爵博尔索·德斯特的《圣经》数字化页面。这是世界上最好的文艺复兴时期的插图手稿之一,原始手稿保存在意大利摩德纳的埃斯特ense大学图书馆。数据集包含640页,经过数字化处理后,通过自动程序进行分割,并手动精炼,最终得到2281张图片。其中41%(903张)的图片被唯一标注为13个类别,其余图片作为干扰项。
- GoogleCH数据集 :通过在Google Images上搜索20个与文化遗产相关的语义概念(如祭坛、考古遗址等)自动爬取得到。每个概念约下载500张图片,排除错误链接后,将图片调整为固定宽度640像素。最终数据集包含9594张图片,每张图片用查询的单个概念进行标注。另外还下载了1000张图片并手动标注所有存在的概念。

2. 基于内容的视觉相似性检索

为了进行有价值的比较,研究人员在圣经数据集上测试了多种基于BoW的视觉描述符以及多元高斯模型。具体使用的描述符包括:
- RGB颜色直方图(localCH)
- 变换颜色直方图(localTCH) <

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值