图像分类与索引:决策树与索引技术解析
1. 决策树用于图像分类
图像是复杂的数据,一个典型的图像通常有多个区域或对象,并且有多种解释。因此,第一步是将图像分割成单个区域,并用一个n维特征向量来表示每个区域:x = (x1, x2, …, xn)。对于彩色图像,每个图像区域用一个颜色特征向量xC和一个纹理特征向量xT表示。由于某些类型的图像区域最好用颜色和纹理共同描述,因此还通过将颜色和纹理组合成单个特征向量xCT来创建第三个特征。
1.1 特征离散化
xC、xT和xCT这三种类型的特征都是连续特征。为了使用分类决策树对这些区域进行分类,需要使用向量量化(VQ)技术将特征量化为离散值。VQ技术的思想是将相似的图像区域聚类成簇,然后为这些簇分配标称值,如0、1、2、…、K。这些标称值对应于决策树分类中使用的类标签,如天空、水、草、烟花、老虎等。常见的VQ算法是LBG算法,如下所示:
LBG (T, K, e) {
Input: T = {xi ∈ Rn; i = 1, 2, ..., N}
Output: C = {cj ∈ Rn; j = 1, 2, ..., K}
1. Initiate a codebook C = {cj ∈ Rn; j = 1, 2, ..., K}
2. Set D0 = 0 and k = 0
3. Classify the N training vectors into K clusters Tq (q = 1, 2, ..., K) and classify xi to Tq if the distance d(xi -
超级会员免费看
订阅专栏 解锁全文
606

被折叠的 条评论
为什么被折叠?



