高光谱图像中的PCA、核PCA与降维技术
1. 核矩阵参数计算与核主成分分析基础
在处理数据时,需要随机计算核矩阵,其中关键参数 $\sigma$ 的计算方式如下:先计算所有代表性模式 $x_i$ 与其他模式的最小距离。若有 $N$ 个模式,就会得到 $N$ 个最小距离,接着计算这 $N$ 个最小距离的平均值,$\sigma$ 取值为该平均值的五倍。所以,$\sigma$ 的值取决于数据集的性质。
核主成分分析(KPCA)是一种将原始 $D$ 维数据集转换为 $d$ 维空间的方法。它本质上是非线性的,利用数据集的高阶统计信息来区分不同类别。选择合适的训练集对于计算 KPCA 的核矩阵至关重要。随机选择的训练模式可能无法很好地代表整个数据集,而且训练集也不宜过大,否则计算量会过大。因此,应该选择原始高光谱数据集的一个合适子集,该子集能很好地代表整个数据集,并且不包含噪声数据。
KPCA 和主成分分析(PCA)有相似的性质,但在不同的空间中进行。两者都需要解决特征值问题,但问题的维度不同,PCA 是 $D \times D$ 维度,KPCA 是 $N \times N$ 维度,其中 $D$ 是数据集的维度,$N$ 是计算核矩阵 $\Psi$ 所需的代表性模式数量。对于高光谱图像,像素点数量 $N$ 非常大,直接对所有像素进行 KPCA 计算很困难。如果随机选择部分像素,可能无法代表整个数据集的特征。所以,更好的方法是根据像素的相似性将其分组,然后从每个组中选取一些代表性像素,组成 KPCA 的代表性模式集。
2. 使用 DBSCAN 聚类选择代表性像素
2.1 DBSCAN 聚类原理
在高光谱图像中,同质区域的像素具有相似的性质,通
超级会员免费看
订阅专栏 解锁全文
2016

被折叠的 条评论
为什么被折叠?



