Image Retrieval Framework

多媒体数据挖掘与图像检索技术

最新推荐文章于 2024-07-12 17:57:35 发布

翻译最新推荐文章于 2024-07-12 17:57:35 发布 · 1k 阅读

文章标签：

#搜索 #framework #算法

Image Algorithm 专栏收录该内容

12 篇文章

订阅专栏

本文探讨了多媒体数据挖掘的原理与应用，重点介绍了图像挖掘的过程与技术，包括图像预处理、特征提取、图像分类与相似性评估，以及基于内容的图像检索（CBIR）的概念与方法。

Abstract

由于社交网络的出现和繁荣发展，产生了很多多媒体资源，在浩瀚的数据源中如何搜索有用的资料为重中之重；Multimedia Data Mining 可以被定义为从媒体数据中，如音频/视频/图像/文本，找到感兴趣的资料。

1. Introduction

在信息爆炸时代，数据之间隐含的信息往往不易察觉，所以通过信息检索，在特定的时间，获取有限的信息满足使用者。

一般说来，从数据库中获取的多媒体文件，必须经过处理，以改善其质量。在这之后，进行多种变换和特征提取，生成多媒体文件的重要特征。通过此类特征，可以发现这些文件的模式差异。在应用过程中，这些模式可以用于评价和说明如何选择有用的信息！

2. The Characteristics ofMultimedia Data Mining

多媒体数据一般具有多维和不规则结构，用其特有的方式表示信息！由下图可知，其为多领域交叉，Data Mining 可以提供大概的处理方向！

Data Mining process大概包含下述流程：

(1). Domain understanding;

(2). Data selection;

(3). Data preprocessing, cleaning and transformation;

(4). Discovering patterns;

(5). Interpretation;

(6). Reporting and using discovered knowledge.

此文以Image Mining为例进行分析。

3. Image Mining

Image Mining找到一种方法，有效的从低层次的像素关系，包含图像或图像序列，发现高层次的物体以及它们之间的关系！其着眼点在于从大量的图像中提取相关模式！

下图为Image Mining 的典型流程！

3.1 Preprocessing

批量处理图像，平滑，几何校正，gamma等预处理，然后进行区域或边缘分割，或者根据需要进行相应检测，如几何图形。

3.2 Feature Extraction andTransformation

Color, edges, shape, and texture等图像识别属性，一般被提取出来进行Image mining.特征一般分为Global descriptors 和Local descriptors，各有千秋，此处不详述！

3.3 Image Mining Techniques

a) Classification:

参数分类器和无参数分类器。其实此条目说的是，监督分类；

数据分类主要分两步：

(1) 确定分类器，描述预定义的数据类型，概念；

(2) 利用适合的模型对数据进行分类；

一般常用的分类器有：决策树，基于准则的分类，神经网络，支持向量机，朴素贝叶斯等。

b) Clustering:

无监督分类，如K均值，此处比较熟悉，略过。

CBIR: An Introduction & Survey

[2] 提出了有效的基于内容的图像检索算法，基于颜色，纹理和边缘直方图等特征；

[3] 提出了新的相似匹配算法，在RGB和HSV颜色空间，基于直方图、象形图的匹配；

4. Image Miningusing CBIR Concepts

CBIR 一般基于查询整幅图像或者图像中的ROI，一般的CBIR系统架构如下图所示。

4.1 ImageContent Descriptors

Color

a.定义恰当的颜色空间

b.提出恰当的提取算法

c.相似性评价算法

Color Histogram

Color Moment

Color Moment常用于减少相似图像的数目然后，在此基础上运行其他算法！

推荐学习MPEG-7中关于多媒体检索的功能。

Texture

纹理主要分为两类：基于结构的和基于统计的，结构式算法包含有形态学操作和连接表；统计式算法包含有Tamura feature, shift-invariant principal component analysis—SPCA, Fourierpower spectra, Wold decomposition, co-occurrence matrices, Markov random field,fractal model 以及多尺度分析工具Gabor 和 wavelet transform.

此处仅简述

Tamura Feature

Tamura’sfeatures are based on psychophysical studies of the characterizing elementsthat are perceived in textures by humans.

Contrast 对比度

Measures the wayin which gray levels q vary in the image I and to what extent theirdistribution is based to black or white.

通过对像素灰度直方图分布情况的统计得到的，其定义公式：