自组织映射:混合SOM - NG算法解析
1. 引言
自组织映射是一类竞争学习神经网络,它借助一组原型向量(也被称作码字、神经元或单元)来对训练数据进行某种形式的表征。这组原型向量的集合被称为码本,它将所有码字整合在一起。
在竞争学习过程中,各个原型会相互竞争,以成为每个数据样本的最佳代表,这个最佳代表原型被称为“最佳匹配单元”(bmu)。学习过程以bmu为核心,根据合作理念的有无,其他原型受到的影响程度会低于bmu。
自组织映射通常属于无监督算法,因为它在训练时并不需要每个数据样本对应的期望输出值。不过,也存在基于原始自组织映射的监督算法,这些算法融入了某种监督学习机制。
接下来,我们将介绍几种经典算法,为理解混合SOM - NG算法奠定基础。
2. k - 均值算法
2.1 算法概述
k - 均值算法是由James MacQueen在1967年提出的一种聚类算法。该算法旨在通过不断重新定位已确定聚类的质心,直至达到收敛状态,从而实现对多维数据的k个划分。它遵循“胜者通吃”的原则,是一种纯粹的竞争算法。
其主要目标是最小化数据样本到聚类质心的平方距离之和,对应的代价函数为:
[E = \sum_{k = 1}^{K} \sum_{x_i \in Q_k} \left | x_i - c_k \right |^2]
其中,$K$ 表示聚类的数量,$Q_k$ 是由质心 $c_k$ 定义的影响区域,$x_i$ 为数据样本。
2.2 算法实现
尽管k - 均值算法有着复杂的数学背景,但它的实现过程却可以用简单的方式来
超级会员免费看
订阅专栏 解锁全文
1617

被折叠的 条评论
为什么被折叠?



