机器学习中的聚类与隐马尔可夫模型
1. 自组织映射(SOM)聚类
自组织映射(Self-Organizing Map,SOM)是一种将数据表示到低维空间的模型,它能自动将相似的数据项聚集在一起。例如,为一群人订购披萨时,每个人对披萨配料的偏好不同,可将每个人的配料偏好表示为三维向量。SOM 能将这些三维向量嵌入到二维空间(前提是定义好披萨之间的距离度量),通过二维可视化图可找出合适的聚类数量。
与 k-means 算法相比,SOM 收敛时间可能更长,但它对聚类数量没有预设要求。在现实世界中,很难预先确定聚类的数量,而 SOM 提供了更灵活的解决方案。
1.1 SOM 算法步骤
- 设计节点网格 :每个节点持有与数据项维度相同的权重向量,节点权重通常初始化为标准正态分布的随机数。
- 识别最佳匹配单元(BMU) :逐个将数据项输入网络,网络会找出权重向量与该数据项最匹配的节点,即 BMU。
- 更新 BMU 邻居节点 :识别出 BMU 后,更新其所有邻居节点的权重向量,使其更接近 BMU 的值。距离 BMU 越近的节点受影响越大,且随着时间推移,BMU 邻居节点的数量会逐渐减少。
1.2 TensorFlow 实现 SOM
以下是使用 TensorFlow 实现 SOM 的代码:
import tensorflow as tf
import numpy as
超级会员免费看
订阅专栏 解锁全文
2124

被折叠的 条评论
为什么被折叠?



