sklearn中KMean()相关参数及可视化
忽然想到学习了这么多的东西,也希望能与其他想学习的人分享分享,就写下了这篇博客了
from sklearn.cluster import KMeans
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']
np.random.seed(123) # numpy中设置随机种子
low_dim_embs = np.random.randint(0, 20, size=300).reshape(150, 2) # 产生300个随机整数,重塑为150个2维数组
kmeans = KMeans(n_clusters=3, random_state=123)
kmeans.fit(low_dim_embs)
plt.figure(figsize=(8, 8))
plt.scatter([i[0] for i in low_dim_embs], [i[1] for i in low_dim_embs], c=kmeans.labels_, marker='x')
plt.axis('off') # 关闭坐标轴
for coordinate in low_dim_embs:
plt.annotate(str(coordinate), xy=coordinate, xytext=(coordinate[0]+0.05, coordinate[1]+0.05)) # 数据标注
plt.show()
代码相关内容里面应该解释的比较清楚了,关于kmeans里面的相关参数如下:
n_clusters : 聚类数目。
init : 可选参数{