Self-organizing Map详解

本文详细介绍了自组织映射(Self-organizing Map,SOM)的原理和训练过程,包括其作为聚类和数据可视化算法的特点。SOM通过保持原始数据的拓扑结构,将高维数据映射到低维空间,形成具有地形序的二维矩阵结构,便于可视化和解释。文章还讨论了SOM算法的优点,如可视化效果好,受初始质心影响小,以及缺点,如缺乏确定目标函数,需自定义空间结构,可能不收敛等。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Self-organizing Map详解

第二十一次写博客,本人数学基础不是太好,如果有幸能得到读者指正,感激不尽,希望能借此机会向大家学习。这一篇文章是原型聚类中介绍的第五个算法,主要是谈一谈“自组织映射”(Self-organizing Map)。其他有关于原型聚类算法的讨论可以移步到该类算法的导航页《原型聚类算法综述(原型聚类算法开篇)》

Self-organizing Map(自组织映射)

  自组织(特征)映射(Self-organizing Map,简称SOM),是一种基于神经网络的聚类和数据可视化算法。这种算法将含有 n n n维向量样本的数据集 D = { x i ∣ i = 1 , 2 , . . . , m } D=\{\mathbf{x}_i|i=1,2,...,m\} D={ xii=1,2,...,m}作为输入,在保证原数据集样本点之间的拓扑结构不变的情况下,通过映射得到一个维度不高于 n n n的空间结构,这个空间结构中的每个点都含有一个权重向量(质心,在SOM中称为参考向量(Reference Vector),将权值向量作为质心的原因是,在映射过程中,样本点要与权值向量进行点积,这种点积运算可以看做是计算两个向量之间的余弦相似度)作为映射参数,因此,SOM也可以看做是原数据集中样本点的非线性回归或者类似于PCA的一种特征缩放的过程。其中,最终得到的空间结构(地形序(Topographic Ordering))由设计者根据SOM算法的使用环境自行定义,一般为了满足数据可视化目的,将其设置为二维空间中的矩阵结构,如下图所示是一个二维空间下的3x3矩形SOM拓扑结构

  虽然同样是对每个样本进行簇指派,并且更新质心,但是与K-Means等基于原型的聚类算法仍有很大的区别,SOM中的质心由于自定义空间结构的影响,而具有预先确定的地形序关系,因此,在质心(参考向量)更新过程中需要考虑与样本点最近的质心(参考向量)及其临近的质心(参考向量)进行增量更新,且更新过程中不记录每个样本隶属的质心(参考向量),在更新完成后,再根据这些质心(参考向量)来分配数据集中的样本到对应的质心(参考向量)中。

SOM训练过程

SOM的训练过程分为初始化质心、随机选取对象、对象的指派和质心的更新,伪代码如下所示

  算法第1行:与K-Means相同,可以在数据集

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值