数据挖掘中的粗糙自组织映射算法解析
自组织映射基础
在数据挖掘领域,自组织映射(SOM)是一种强大的工具,用于对输入模式的分布进行可视化和聚类。首先,在竞争层中,会选择与输入模式匹配值最小的单元作为获胜单元。若有两个单元匹配值相同,则选择索引值较小的单元。
接下来是构建一个二维映射,以反映输入模式的分布。为实现这一目标,通过定义获胜单元周围的邻域集 $N_c$ 来进行侧向交互。在每个学习步骤中,仅更新 $N_c$ 内的单元,而 $N_c$ 外的单元保持不变。更新方程如下:
$\Delta m_{ij} =
\begin{cases}
\alpha(x_j - m_{ij}) & \text{如果单元 } i \text{ 在邻域 } N_c \text{ 内} \
0 & \text{否则}
\end{cases}$
$m_{ij}^{new} = m_{ij}^{old} + \Delta m_{ij}$
其中,$\alpha$ 是学习参数。这种调整使得获胜单元及其邻居的权重更接近输入模式,从而增加了在后续遇到相同或相似输入模式时获胜的可能性。
邻域 $N_c$ 的宽度或半径可以随时间变化。实验表明,初始时 $N_c$ 较宽,然后随时间单调缩小,有利于形成良好的全局排序。宽的初始 $N_c$ 对应学习过程中的粗空间分辨率,能先诱导出 $m_i$ 值的大致全局顺序,随后缩小 $N_c$ 可提高映射的空间分辨率,且不会破坏已获得的全局顺序,进而形成映射的拓扑顺序。
粗糙集与自组织映射的结合(RSOM)
粗糙集理论生成的依赖规则可用于根据对象的属性来区分对
超级会员免费看
订阅专栏 解锁全文
1054

被折叠的 条评论
为什么被折叠?



