使用kmeans聚类算法进行预测
如何寻找K值, 可以通过轮廓系数 来筛选判断比较
# 라이브러리를 임포트합니다.
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans
# 加载数据
iris = datasets.load_iris()
features = iris.data
# 标准化
scaler = StandardScaler()
features_std = scaler.fit_transform(features)
# 创建KMeans 对象
cluster = KMeans(n_clusters=3, random_state=0, n_jobs=-1)
# 你和训练
model = cluster.fit(features_std)
# 查看预测的类
model.labels_
array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,