学习目标:
- 60天python训练营打卡
学习内容:
DAY 17 常见聚类算法
知识点
1.聚类的指标
2.聚类常见算法:kmeans聚类、dbscan聚类、层次聚类
3.三种算法对应的流程
实际在论文中聚类的策略不一定是针对所有特征,可以针对其中几个可以解释的特征进行聚类,得到聚类后的类别,这样后续进行解释也更加符合逻辑。
聚类的流程
1.标准化数据
2.选择合适的算法,根据评估指标调参( )
KMeans 和层次聚类的参数是K值,选完k指标就确定
DBSCAN 的参数是 eps 和min_samples,选完他们出现k和评估指标
以及层次聚类的 linkage准则等都需要仔细调优。
3.将聚类后的特征添加到原数据中
4.原则t-sne或者pca进行2D或3D可视化
学习时间:
2025.05.31
211

被折叠的 条评论
为什么被折叠?



