基于内容的图像检索:入门指南
1. 多媒体信息检索
信息检索的含义十分广泛,在计算机科学领域,其一般定义为:“信息检索(IR)是从大量集合(通常存储在计算机中)里找出满足信息需求的非结构化材料(通常是文档)”。信息检索领域还涵盖支持用户浏览或筛选文档集合,以及对一组检索到的文档进行进一步处理。
给定一组文档,聚类就是根据文档内容对其进行良好分组的任务,这类似于根据主题在书架上摆放书籍。给定一组主题、长期信息需求或其他类别(如不同年龄段适用的文本),分类则是确定一组文档分别属于哪些类别(如果有的话)的任务。通常的做法是先手动对一些文档进行分类,然后希望能够自动对新文档进行分类。
如果文档类型为图像、视频、声音等,那么这种检索就被称为多媒体信息检索。多媒体信息检索系统能够存储、索引、搜索和交付多媒体数据。这里我们主要关注数字图像的搜索,用于从数据库中搜索图像的系统被称为图像检索系统。
2. 图像检索
随着现代技术的发展,相机和手机相机等拍照设备变得更加经济实惠、便于携带且易于获取,拍照设备的使用量呈指数级增长。随着互联网和多媒体技术的进步,大量的音频、视频和图像等多媒体数据被应用于医疗、卫星数据、视频和静态图像存储库、数字取证和监控系统等众多领域。这就产生了对能够有效存储和检索多媒体数据的系统的持续需求。到目前为止,已经开发了许多多媒体信息存储和检索系统来满足这些需求。
图像检索被定义为从图像数据库中检索语义相关的图像。从图像内容中自动推导语义有意义的信息是大多数图像数据库研究的重点。用户在搜索图像时,对自己想要的东西只有一个非常抽象的概念。目前的图像检索系统试图解决这个问题,但仍然不足以基于人类感知自动理解图像的语义含义,这个问题
超级会员免费看
订阅专栏 解锁全文

431

被折叠的 条评论
为什么被折叠?



