基于SOM聚类和改进倒排索引的视觉概念特征空间图像搜索
1. 引言
随着图像数据的指数级增长,对管理、检索和可视化大量图像的创新工具需求日益迫切。计算机硬件存储成本降低、数字设备普及、高带宽通信设施以及万维网成像技术的快速发展,使得这些需求成为可能。许多应用,如数字图书馆、图像搜索引擎和医疗决策支持系统,都需要有效的基于内容的图像检索(CBIR)技术。
CBIR根据图像的低层次特征(如颜色、纹理、形状、边缘等)的视觉相似性来计算查询图像和数据库图像的相关性。然而,经过近二十年的深入研究,CBIR系统仍落后于当今最好的基于文本的搜索引擎,主要问题在于用户需求的高层次概念与图像的低层次表示之间存在“语义鸿沟”。
为了缩小“语义鸿沟”,一些方法采用了基于“概念袋”的图像表示方案,将局部计算的图像特征视为视觉概念。一些研究表明,基于“词袋”的局部特征适用于场景分类。但目前大多数基于概念的图像表示方案假设每个概念相互独立,而实际上图像中存在相关或共现的概念。因此,有必要利用概念之间的相关性或共现模式来提高检索效率。
本文提出了一种基于概念特征空间的相关性增强相似度匹配和查询扩展框架,利用自组织映射(SOM)生成的码本的拓扑结构,构建了全局相似度/相关矩阵,并在改进的倒排索引中进行查询扩展,以提高检索效率。
2. 基于视觉概念的图像表示
2.1 视觉概念的定义
“视觉概念”指的是在图像区域中局部识别的可感知的颜色和/或纹理块。例如,在医学图像中,可以识别出特定的局部纹理模式或颜色结构。这些局部块的变化可以通过无监督聚类或监督分类技术进行有效建模。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



