无监督数据处理与多层人工神经网络实现
1. 无监督学习中的聚类分析
在无监督学习领域,聚类分析是发现数据中隐藏结构和信息的重要手段。这里介绍三种不同的聚类算法。
1.1 k - 均值算法
k - 均值是一种基于原型的方法,它依据指定数量的聚类中心,将样本聚类成球形。由于聚类是无监督方法,没有真实标签来评估模型性能,因此采用了诸如肘部法或轮廓分析等内在性能指标,尝试量化聚类质量。
1.2 凝聚层次聚类
与 k - 均值不同,凝聚层次聚类无需预先指定聚类数量,其结果可以用树状图表示,有助于对结果进行解读。
1.3 DBSCAN 算法
DBSCAN 算法基于局部密度对数据点进行分组,能够处理离群点并识别非球状形状。
下面是这三种聚类算法的对比表格:
| 算法名称 | 是否需指定聚类数 | 处理离群点能力 | 聚类形状 |
| ---- | ---- | ---- | ---- |
| k - 均值 | 是 | 弱 | 球形 |
| 凝聚层次聚类 | 否 | 一般 | 多种 |
| DBSCAN | 否 | 强 | 非球状 |
mermaid 格式流程图展示聚类分析流程:
graph LR
A[数据输入] --> B{k - 均值聚类}
A --> C{凝聚层次聚类}
A --> D{DBSCAN 聚类}
B --> E[评估聚类质量]
C --> E
无监督聚类与多层神经网络
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



