深度学习 自组织映射网络 ——python实现SOM(用于聚类)
摘要
SOM(Self Organizing Maps ) 的目标是用低维目标空间的点来表示高维空间中的点,并且尽可能保持对应点的距离和邻近关系(拓扑关系)。该算法可用于降维和聚类等方面,本文通过python实现了该算法在聚类方面的应用,并将代码进行了封装,方便读者调用。
下图为正文计算实例的可视化图形。

python实现代码
net:竞争层的拓扑结构,支持一维及二维,1表示该输出节点存在,0表示不存在该输出节点
epochs:最大迭代次数
.r_t:[C,B] 领域半径参数,r = C*e**(-B * t/eoochs),其中t表示当前迭代次数
eps:[C,B] learning rate的阈值
用法:指定竞争层的拓扑结构、 最大迭代次数、领域半径参数、学习率阈值(后三个参数也可不指定),竞争层的拓扑结构的节点数代表了聚类数目,然后直接调用fit(X) 进行数据集的聚类。
# -*- coding: utf-8 -*-
# @Time : 2021/1/12 22:37
# @Author : CyrusMay WJ
# @FileName: SOM.py
# @Software: PyCharm
# @Blog :https://blog.csdn.net/Cyrus_May
import numpy as np
import random
np.random.seed(22)
class CyrusSOM(object):
def __init__(self,net=[[1,1],[1,1]],epochs = 50,r_t = [None,None],eps=1e-6):
"""
:param net: 竞争层的拓扑结构,支持一维及二维,1表示该输出节点存在,0表示不存在该输出节点
:param epochs: 最大迭代次数
:param r_t: [C,B] 领域半径参数,r = C*e**(-B*t/eoochs),其中t表示当前迭代次数
:param eps: learning rate的阈值
"""
self.epochs = epochs
self.C = r_t[0]
self.B = r_t[1]
self.eps = eps
self.output_net = np.array(net)
if len(self.output_net.shape) == 1:
self.output_net = self.output_net.reshape([-1,1])
self.coord = np.zeros([self.output_net.shape[0],self.output_net.shape[1],2])
for i in range(self.output_net.shape[0]):
for j in range(self.output_net.shape[1]):
self.coord[i,j] = [i,j]
print(self.coord)
def __r_t(self,t):
if not self.C:
return 0.5
else:
return self.C*np.exp(-self.B*t

本文聚焦SOM算法,其目标是用低维空间点表示高维空间点并保持拓扑关系,可用于降维和聚类。通过Python实现该算法在聚类方面的应用,封装代码方便调用,还给出对簇形状数据集聚类的计算实例,仅五步就能实现较好聚类结果。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



