kmeans DBSCAN LDA聚类 TSNE对聚类效果进行可视化展示

最新推荐文章于 2024-03-21 14:25:43 发布

原创

最新推荐文章于 2024-03-21 14:25:43 发布 · 2k 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#自然语言处理 #数据挖掘

本文详细介绍并演示了kmeans、DBSCAN、LDA和TSNE四种聚类算法的应用，包括代码实现与可视化展示，为读者提供了丰富的实践案例。

kmeans DBSCAN LDA聚类 TSNE对聚类效果进行可视化展示

对代码进行记录，方便以后使用

kmeans聚类代码

from sklearn.cluster import KMeans
km_cluster = KMeans(n_clusters=3, max_iter=300, n_init=40,init='k-means++', n_jobs=-1)
result = km_cluster.fit_predict(data)#对句子进行聚类时,data是一个二维的nparray,每个内层的nparray代表每个句子的语义向量，示例  data = np.array([[1.12486,-2.1483,0.1482],[-0.1473,-1.2564,3.1452]])

参数备注：
1）n_clusters：聚类类别数，人为指定
2）max_iter：迭代次数
3）n_jobs：进程数量，值为-1时代表线程全开
4）result:每一个句子的聚类结果标签，数据类型为np.array，假如对句子1，句子2，句子3进行聚类，句子1和句子2是一类，句子3单独是一类，则result的值为[0,0,1]