基于内容的图像检索与多媒体交互技术探索
1. 基于内容的图像检索概述
随着图像库的快速增长,高效且有效的图像检索工具变得至关重要。基于内容的图像检索(CBIR)技术直接从图像数据中提取特征,并利用这些特征查询图像集合。图像特征通常描述图像的颜色、纹理和形状等“内容”。接下来,我们将深入探讨CBIR的一些高级主题。
2. 从压缩图像中提取图像特征
由于存储空间和带宽的限制,绝大多数图像都是压缩的。然而,传统的CBIR技术通常在像素域(即未压缩的数据)上运行,因此在计算特征之前需要对图像进行解压缩,这会带来计算开销。压缩域检索技术允许直接在压缩图像数据上执行CBIR。
2.1 JPEG压缩技术
JPEG是当今图像压缩的事实标准,它是一种有损压缩技术。为了实现高压缩率(通常在1:20到1:100之间),会牺牲一些原始信息,压缩后的图像与原始图像会有差异,但与减少空间需求所带来的收益相比,这些差异较小。
JPEG的压缩过程如下:
1. 图像分块 :将图像分割成8×8的图像子块。
2. 离散余弦变换(DCT) :对每个块执行二维离散余弦变换,得到一个直流(DC)系数和63个交流(AC)系数。DC系数描述该块的平均值,AC系数表示较高的频率。
3. 量化 :由于图像在区域上变化缓慢,大部分能量集中在DC和较低的AC系数中,因此可以对较高频率进行更粗略的编码。量化步骤优先考虑较低频率,这使得JPEG成为一种有损技术,因为量化不是唯一可逆的。
4. 编码 </