##kmeans

import matplotlib.pyplot as plt
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
from sklearn.metrics import calinski_harabasz_score

# 创建数据集
# X为样本特征, Y为样本簇类别, 共1000个样本, 每个样本2个特征, 共4个簇,
# 簇中⼼在[-1,-1], [0,0],[1,1], [2,2], 簇⽅差分别为[0.4, 0.2, 0.2, 0.2]
X, y = make_blobs(n_samples=1000, n_features=2, centers=[
    [-1, -1], [0, 0], [1, 1], [2, 2]], cluster_std=[0.4, 0.2, 0.2, 0.2], random_state=9)


# 原始数据图
# plt.scatter(X[:, 0], X[:, 1], marker="o")
# plt.show()
#  归为两类

    # kmeans训练,且可视化 聚类=2
y_pre = KMeans(n_clusters=2, random_state=9).fit_predict(X)
#
#     # 可视化展示
plt.scatter(X[:, 0], X[:, 1], c=y_pre)
plt.show()
#
#     # 用ch_scole查看最后效果
print(calinski_harabasz_score(X, y_pre))
#
# KMeans_2()
# 归为三类
# def KMeans_3():
#     # kmeans训练,且可视化 聚类=3
#     y_pre = KMeans(n_clusters=3, random_state=9).fit_predict(X)
#
#     # 可视化展示
#     plt.scatter(X[:, 0], X[:, 1], c=y_pre)
#     plt.show()
#
#     # 用ch_scole查看最后效果
#     print(calinski_harabasz_score(X, y_pre))
#
# KMeans_3()

# 归为四类
def KMeans_4():
    # kmeans训练,且可视化 聚类=4
    y_pre = KMeans(n_clusters=4, random_state=9).fit_predict(X)

    # 可视化展示
    plt.scatter(X[:, 0], X[:, 1], c=y_pre)
    plt.show()

    # 用ch_scole查看最后效果
    print(calinski_harabasz_score(X, y_pre))

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值