集成学习与无监督学习结合的研究及应用
1. 研究概述
本次研究聚焦于集成学习与无监督学习的结合,同时涉及统计主成分分析(PCA)与集成学习的融合。其核心贡献在于拓扑保持映射,主要目标是提升统计和神经元方法在数据可视化任务中的可视化能力。
2. 主要贡献
2.1 异常值评估与处理方法
通过结合Bagging算法和统计PCA,提出了一种评估和识别异常值的方法,一定程度上解决了数据集中包含异常值的处理问题。具体操作是对重采样数据集进行重复PCA分析,对每个重采样数据集找到的成分进行平均和比较。通过观察不同分析找到的方向表示的离散程度,该模型能够检测数据集中异常值的存在。在人工和真实数据集上的测试均取得了良好效果。
2.2 拓扑保持映射融合算法
- 初步算法 - Superposition :对拓扑保持映射的融合进行了初步探索。
- 改进算法 - WeVoS :这是研究的核心贡献。该算法计算组成集成的地图上每个神经元的质量度量,然后为最终地图中的神经元分配最适宜的最终神经元权重。对该算法与几种拓扑保持算法的结合进行了全面研究,使用了SOM、ViSOM、SIM和Max - SIM等数据集和集成组合算法。
3. 实验结论
- 算法通用性 :一般而言,WeVoS算法对所有拓扑保持模型的作用方式相似,不受集成所基于的模型影响。
- 训练方式影响 :集成的训练方式直接影响最终结果地图,
集成与无监督学习融合研究
超级会员免费看
订阅专栏 解锁全文

1万+

被折叠的 条评论
为什么被折叠?



