一、算法简介
K-means算法是一种常见的无监督学习聚类算法,其基本思想是将n个样本划分为k个簇,每个簇内的样本之间的相似度要尽可能的大,而不同簇之间的相似度要尽可能的小,通过最小化各个簇内点与该簇中心点的距离和来实现。
二、具体算法流程
Kmeans:
1. 初始化: 随机选取k个点作为簇中心;
2. 计算距离: 根据选取的距离度量方式(通常为欧氏距离)计算每个样本到k个中心的距离;
3. 分配样本点: 将每个样本点划分为距离最近的簇;
K-means算法是一种常见的无监督学习聚类算法,其基本思想是将n个样本划分为k个簇,每个簇内的样本之间的相似度要尽可能的大,而不同簇之间的相似度要尽可能的小,通过最小化各个簇内点与该簇中心点的距离和来实现。
Kmeans:
1. 初始化: 随机选取k个点作为簇中心;
2. 计算距离: 根据选取的距离度量方式(通常为欧氏距离)计算每个样本到k个中心的距离;
3. 分配样本点: 将每个样本点划分为距离最近的簇;