无监督机器学习聚类算法-K-均值（K-means）

原创

于 2025-06-26 19:42:04 发布 · 831 阅读

·

14

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #支持向量机 #人工智能

K-均值（K-means）是一种经典的无监督机器学习聚类算法，由MacQueen于1967年首次提出[1]。该算法旨在将包含n个数据点的数据集X = { x₁, x₂, ..., xₙ}划分成K个不相交的簇C = {C₁, C₂, ..., Cₖ}，使得簇内平方和（Within-Cluster Sum of Squares, WCSS）最小化。

算法数学描述

K-means算法的目标是最小化以下目标函数：

J = ∑ᵢ₌₁ᴷ ∑ₓ∈Cᵢ ||x - μᵢ||²

其中：

μᵢ 是第i个簇的质心（centroid）
||x - μᵢ||² 表示数据点x与质心μᵢ之间的欧几里得距离的平方

算法工作流程

1. 初始化阶段

选择K个初始聚类中心点μ₁⁽⁰⁾, μ₂⁽⁰⁾, ..., μₖ⁽⁰⁾。常用的初始化方法包括：

随机初始化
K-means++初始化[2]：选择彼此距离较远的初始中心点

2. 分配步骤（Assignment Step）

对于每个数据点xⱼ，将其分配到最近的簇：

cⱼ⁽ᵗ⁾ = arg min₁≤ᵢ≤ₖ ||xⱼ - μᵢ⁽ᵗ⁻¹⁾||²

其中cⱼ⁽ᵗ⁾

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。