18、数据挖掘中的粗糙自组织映射算法解析

最新推荐文章于 2025-12-01 11:46:25 发布

c8d9e0f1

最新推荐文章于 2025-12-01 11:46:25 发布

阅读量35

点赞数

CC 4.0 BY-SA版权

分类专栏：模式识别与数据挖掘文章标签：数据挖掘粗糙集自组织映射

本文链接：https://blog.youkuaiyun.com/c8d9e0f1/article/details/152100448

模式识别与数据挖掘专栏收录该内容

24 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

数据挖掘中的粗糙自组织映射算法解析

自组织映射基础

在数据挖掘领域，自组织映射（SOM）是一种强大的工具，用于对输入模式的分布进行可视化和聚类。首先，在竞争层中，会选择与输入模式匹配值最小的单元作为获胜单元。若有两个单元匹配值相同，则选择索引值较小的单元。

接下来是构建一个二维映射，以反映输入模式的分布。为实现这一目标，通过定义获胜单元周围的邻域集 $N_c$ 来进行侧向交互。在每个学习步骤中，仅更新 $N_c$ 内的单元，而 $N_c$ 外的单元保持不变。更新方程如下：
$\Delta m_{ij} =
\begin{cases}
\alpha(x_j - m_{ij}) & \text{如果单元 } i \text{ 在邻域 } N_c \text{ 内} \
0 & \text{否则}
\end{cases}$
$m_{ij}^{new} = m_{ij}^{old} + \Delta m_{ij}$
其中，$\alpha$ 是学习参数。这种调整使得获胜单元及其邻居的权重更接近输入模式，从而增加了在后续遇到相同或相似输入模式时获胜的可能性。

邻域 $N_c$ 的宽度或半径可以随时间变化。实验表明，初始时 $N_c$ 较宽，然后随时间单调缩小，有利于形成良好的全局排序。宽的初始 $N_c$ 对应学习过程中的粗空间分辨率，能先诱导出 $m_i$ 值的大致全局顺序，随后缩小 $N_c$ 可提高映射的空间分辨率，且不会破坏已获得的全局顺序，进而形成映射的拓扑顺序。