基于流形降维和稀疏表示的特征分类与夜视数据分类方法
在数据处理和分析领域,特征分类和数据分类是至关重要的任务。然而,面对高维数据、不同类距离以及异常值干扰等问题,传统方法往往难以取得理想的效果。本文将介绍基于流形降维的特征分类方法以及基于稀疏表示和随机子空间的夜视数据分类方法。
基于流形降维的特征分类
在特征分类方面,有几种重要的算法值得关注,包括KML - KLLE、WLLE和GLE等。这些算法在处理数据时各有特点。
1. 算法比较
- WLLE :使用加权距离测量,假设数据服从标准正态分布来估计概率密度函数。对于高密度的原型数据给予较小的权重缩放,而低密度的数据则给予较大的权重缩放。
- GLE :通过几何距离选择邻居,几何距离定义为每个点到跨越主向量的线性流形的欧几里得距离,用主向量确定的平行多面体的体积表示。
- KML - KLLE :对数据点执行局部KML,KML算法能衡量每个点来自底层数据流形的可能性,这对后续的KLLE学习过程至关重要。KML基于稳健统计来减少分布偏差的影响,结合了密度(KMD)和平行多面体体积(KPCA)的概念,在异常值检测中综合了WLLE和GLE的思想,并且利用核来匹配复杂数据集中的理想分布。
2. 异常值处理能力
在存在异常值的情况下,普通数据点的N个最近邻可能不再位于流形的局部线性补丁上,这会给重构带来小偏差。而异常值点的邻域通常比普通数据大且不规则,其邻居的重构权重不能很好地反映高维输入空间中流形
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



