内容基于图像检索:原理、技术与应用
1. 数字图像的爆炸式增长
在过去十年间,我们见证了每日拍摄、存储和分享的数字图像数量持续攀升。据相关研究保守估计,2017 年拍摄的数字照片数量超过 1 万亿张,其中约 85% 由手机拍摄。同年,全球以数字形式存储的照片近 5 万亿张,大量照片可通过网页、图片库(如 Flickr 和 Shutterstock)以及社交媒体(如 Facebook、Instagram 等)在互联网上获取。
但这些“图像数据库”大多未经过分类,也没有附带元数据和标签。若有这些信息,在数据库中搜索图像将变得简单快捷。
2. 内容基于图像检索(CBIR)的概念
假设我们想从数据库中检索包含狮子的图像,若没有标签,就只能依据图像内容进行搜索。我们以一张狮子图片作为查询图像,要求系统返回“相似”图像,这一过程即内容基于图像检索(CBIR)。鉴于我们周围图像数量庞大,开发快速的 CBIR 算法并合理组织数据库以实现高效搜索至关重要。
CBIR 算法需解决两个主要挑战:
- 如何通过低维描述符高效、高度压缩地表征图像内容(此阶段称为图像索引)。
- 如何快速搜索索引空间。
3. 图像检索的类型
3.1 基于文本的图像检索
基于文本的图像检索依赖于图像附带的文本描述、标签或元数据来进行搜索。用户输入关键词,系统根据文本信息匹配相关图像。这种方法简单直接,但存在局限性,如需要人工标注大量图像,且标注可能不准确或不完整,导致检索结果不准确。
3.2 基于内容的图像检索
基于内容的图像检索则是根据图像的视觉内容
超级会员免费看
订阅专栏 解锁全文
18万+

被折叠的 条评论
为什么被折叠?



