内容式图像检索:原理、技术与应用
1. 图像检索的背景与需求
在过去十年里,每天拍摄、存储和分享的数字图片数量持续增长。据保守估计,2017 年拍摄的数字照片数量超过 1 万亿,其中约 85% 是用手机拍摄的。同年,全球以数字形式存储的照片几乎达到 5 万亿张,大量照片通过网页、图片库(如 Flickr 和 Shutterstock)以及社交媒体(如 Facebook 和 Instagram)在互联网上共享。
然而,绝大多数这些“图像数据库”既没有分类,也没有附带元数据和标签。如果想要从数据库中检索包含特定对象(如狮子)的图像,在没有标签的情况下,就需要仅基于图像内容进行搜索。这一过程被称为基于内容的图像检索(CBIR)。鉴于我们周围图像数量巨大,开发快速的 CBIR 算法并合理组织数据库以实现高效搜索至关重要。
2. 图像检索的类型
图像检索主要分为基于文本的图像检索和基于内容的图像检索:
- 基于文本的图像检索 :这种方式依赖于图像附带的文本描述、标签或元数据来进行搜索。例如,在一个带有详细标签的图像数据库中,用户可以通过输入“狮子”这个关键词来查找包含狮子的图像。但这种方法的局限性在于,并非所有图像都有准确和完整的文本描述,对于大量缺乏标签的图像,基于文本的检索就无法发挥作用。
- 基于内容的图像检索(CBIR) :当没有可用的文本标签时,CBIR 通过分析图像的视觉内容来进行检索。用户提供一个查询图像(如一张狮子的图片),系统会返回与之“相似”的图像。CBIR 算法需要解决两个主要挑战:一是如何用低维描述符高效、高压缩地表征图像内容(图像索引阶段);二是
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



