KMeans聚类

原理and代码

"""
这里使用numpy来简单的手搓一下k-means的原理代码
"""
import numpy as np


def kmeans(X, K, max_iters=300):
    # 随机初始化 k 个聚类中心, 这里choice中的a只能是整数或者一维数组; 多维数组无法确定抽取什么
    # X: M * N, 其中N为特征数
    # centroids: K * N -> K * 1 * N
    # 想要得到一个: M * K * N 的矩阵, 需要为X增加一个维度, 变成: M * 1 * N
    centroids = X[np.random.choice(X.shape[0], K, replace=False)]
    
    for _ in range(max_iters):
        # distances = np.linalg.norm(X - centroids[:, np.newaxis], axis=2)
        distances = np.sqrt(((X[:, np.newaxis] - centroids) ** 2).sum(axis=2))
        # 算出每一个点属于哪一个聚类中心
        labels = np.argmin(distances, axis=1)
        # 计算新的聚类中心
        new_centroids = np.array([X[labels == k].mean(axis=0) for k in range(K)])
        # 如果聚类中心不再变化,停止迭代
        if np.all(new_centroids == centroids):
            break
        centroids = new_centroids

    return labels, centroids
    


if __name__ == "__main__":
    data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
    kmeans(data, 2)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值