pip install sklearn
#生成随机数据
from sklearn.datasets import make_blobs
"""
centers : int 用于生成随机数据得中心点个速
random_state=int 设置随机数据起始值 (这里可以达到生成固定数据得功效)
c=y y是标签 这样会上色
"""
x,y=make_blobs(centers=2,random_state=int)
x 是点 y是属于那个组得标签
import matplotlib.pyplot as plt
plt.scatter(X[:,0],X[:,1],c=y)
聚类算法发现 2簇数据点中心
from sklearn.cluster import KMeans
KMeans需要告诉潜在中心 会严格按照你告诉他得去分
1生成一个km得算法模型
km = KMeans(n_clusters=2)
#fit训练
km.fit(X)
#cluster_centers 返回聚类中心
km.cluster_centers_
#predict 根据模型预测的分组值
km.predict(X)
#真实的分组结果
y