kmeans DBSCAN LDA聚类 TSNE对聚类效果进行可视化展示
对代码进行记录,方便以后使用
kmeans聚类代码
from sklearn.cluster import KMeans
km_cluster = KMeans(n_clusters=3, max_iter=300, n_init=40,init='k-means++', n_jobs=-1)
result = km_cluster.fit_predict(data)#对句子进行聚类时,data是一个二维的nparray,每个内层的nparray代表每个句子的语义向量,示例 data = np.array([[1.12486,-2.1483,0.1482],[-0.1473,-1.2564,3.1452]])
参数备注:
1)n_clusters:聚类类别数,人为指定
2)max_iter:迭代次数
3)n_jobs:进程数量,值为-1时代表线程全开
4)result:每一个句子的聚类结果标签,数据类型为np.array,假如对句子1,句子2,句子3进行聚类,句子1和句子2是一类,句子3单独是一类,则result的值为[0,0,1]
DBSCAN聚类代码
import numpy as np # 数据结构

本文详细介绍并演示了kmeans、DBSCAN、LDA和TSNE四种聚类算法的应用,包括代码实现与可视化展示,为读者提供了丰富的实践案例。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



