目录
Abstract
近年来,基于空间——光谱的方法被广泛应用于高光谱图像分类领域。本文提出了一种基于亚像元目标检测的高光谱图像分类算法。它有四部分组成:
- 预处理部分:包括波段选择(BS)和非线性波段扩展(NE)——称之为BSNE,得到的各单波段图像集合称之为BSNE集合;
- ICEM算法检测阶段:利用CEM(constrained energy minimization)算法计算亚像元目标图,利用高斯滤波器对计算所得的目标图进行滤波,捕获到图像的空间信息。之后将高斯滤波后的CEM检测结果加入BSNE集合,再一次执行CEM算法,提高其检测性能。这样迭代执行CEM算法时,将其称为ICEM(iterative constrained energy minimization);
- 利用Otsu’ method将ICEM的检测所得的灰度图转换为二值图像,此二值图像可用于进一步分类;
上述算法称为BSNE-ICEM,实验表明,本文提出的算法易于实现、所需调整的参数较少、分类精度优于基于支持向量机的算法。
Intorduction
基于SVM的算法的局限性:
- SVM是基于纯像元的分类方法,它难以考虑到光谱混合效应;
- 评价准则OA、AA、kappa稀疏并不能有效评价分类性能,如对于背景的分类性能;
- 基于SVM的算法往往利用不同比例的交叉验证方法对模型进行训练和测试,这样,便不会将来自其他类的错误分类的数据样本视为错误分类的数据样本。这就导致了错误的分类率不包括在分类评估中;
CEM是一种亚像元目标检测算法,通过计算一个像元中各端元的丰度值,检测器可以根据预先设定的阈值参数 τ \tau τ做出软判决,用于目标检测。这个性质可以将CEM用于二分类任务。以假设 H 1 H_1 H1表示我们所感兴趣某一类,以假设 H 0 H_0 H0表示其它类——称之为背景(BKG)类,这样此检测器就成为了一个二分类器。检测器试图在样本空间中寻找一个边界将两个类分开,而分类器对不同样本打上标签。从图像处理的角度看,检测器是一种边界检测器,而分类器是一种阈值技术。因此,检测器可以用于二分类任务,以实现与二分类SVM相同的功能。CEM是一种软判决算法,而二元SVM是一种硬判决算法。
为了解决非线性分类问题,SVM算法引入了核方法。基于类似的思路,由于CEM算法也是一种线性方法,类似于SVM中的核方法,对HSI进行BSNE预处理,可以使得CEM算法更好地处理非线性问题。对于检测结果,利用高斯滤波器对图像进行滤波,可以有效地利用图像中的空间信息,提高检测和分类的性能。将高斯滤波的结果加入BSNE所得的集合中,再次执行CEM进行检测时,可以有效提高算法性能。如此对CEM算法进行迭代的方法称为ICEM。
以往论文中,通常使用OA、AA、Kappa系数评价空间——光谱分类方法的性能。由于CEM算法是一种软判决算法,它在对某特定类型的地物进行检测时,在假设 H 0 H_0 H0下,包含连续的连续的光谱信息和背景信息,OA、AA、kappa系数并不能有效地考虑到这种信息。文章作者引入了查全率、查准率、虚警率、准确率来解决这个问题。上述几项指标可以通过对CEM检测结果使用Otsu算法进行阈值化后得到的混淆矩阵进行计算。
本文的创新点:
- 将亚像元目标检测算法CEM应用于HSI分类
- 使用非线性波段扩展获取HSI中的非线性信息
- 将ICEM算法与高斯滤波相结合,同时利用HSI的空间信息和光谱信息
- CEM是一种软检测器,Otsu算法使其结果二值化,由此可以得到混淆矩阵,进而可以利用查全率、查准率、虚警率、准确率等指标对分类性能进行评价,这一操作将亚像元检测转化为纯像元分类,
- 传统方法利用与训练集同属一类的样本对分类器性能进行评价。在本文中,使用更加广泛的测试样本对BSNE-ICEM算法进行测试,包括用于训练的样本类,来自其他类的样本以及来自背景的样本。
Band Selection
波段选择可分为有监督波段选择和无监督波段选择两类。
对于有监督波段选择(BS),往往需要先指定它的应用领域,如分类、检测、解混等,再利用先验知识(如训练数据集)确定波段选择的特征,之后利用一个特征提取算法,对其波段进行排序,选取合适的波段。
对于无监督波段选择算法(UBS),并没有可用于波段选择先验知识。一般会设计一个基于数据特征或统计特性(如方差、信噪比、信息散度等)波段排序准则,为每个波段计算一个得分用于它们的排序。无监督波段选择并不利用任何先验知识,故它可用于各种应用场景。
无监督波段选择算法的优点为:
- 实现简单
- 无需先验知识
- 无先验知识时基于信息论中最大熵理论的均匀波段间去相关
- UBS可以尽可能稀疏地选取波段,使得波段之间地相关性最小化
本文中,利用UBS算法选取部分波段,以去除HSI中的冗余波段。
Nonlinear Band Expansion Process
HSI中包含不能从原始数据中提取出的非线性信息。传统的非线性波段扩展方法是相关波段非线性扩展方法(Correlation Band Expansion Process),这种方法利用自相关和互相关计算实现非线性扩展;然而这种方法并不能有效提取地形和地理变化导致的非线性信息。为了克服这一问题,人们提出了一种波段之间求比值的非线性波段扩展算法成为波段比值扩展算法(Band Ratio Expansion Process)。
-
相关波段非线性扩展方法(Correlation Band Expansion Process)
在实验中,作者发现,Step2中的2)产生的互相关波段已经能产生足够的非线性信息了。Step2中的1)产生的自相关波段与其自生十分相似,在矩阵计算过程中往往会产生非奇异性问题(nonsingularity problems),因此建议不要单独使用自相关波段,而是与互相关波段相结合使用。这可以由下面的事实解释:包含协方差和方差的互相关矩阵包含的信息量多于仅仅包含方差的对角矩阵。 -
波段比值扩展算法(Band Ratio Expansion Process)
BR(Band Ratio)的使用使得波段之间的差异增强,同时降低了地形(topography)的影响。BR已被广泛应用于多光谱图像来缓解地形斜率和不同光照下的阴影产生的影响。在高光谱数据的处理中,BR也被用于检测高光谱图像中的隐藏目标。
设各波段图像的灰度区间为 { g 1 , g 2 , . . . , g T } \{g_1,g_2,...,g_T\} { g1,g2,...,gT},其中各值按升序排列。若 B k \mathbf{B}_k Bk中的某个像素值为0,则对应(1)式中 B R j k = B j \mathbf{BR}_{jk}=\mathbf{B}_j BRjk=Bj。这样,实际上 B R j k \mathbf{BR}_{jk} BRjk的灰度值区间为 1 / g T 1/g_T 1/gT和 g T g_T g