k-均值算法可能不收敛到局部最小值

原创

于 2025-09-15 10:30:54 发布 · 369 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#k-均值算法 # 局部最小值 # 收敛性分析

17、证明 k - 均值算法可能收敛到一个并非局部最小值的点。假设 k = 2，样本点为 {1,2,3,4} ⊂R，在定义 Ci 时，通过将 i 赋值为 argmin j ∥x - µj∥ 中的最小值来打破平局。

k-均值算法收敛性分析

1. k-均值算法步骤

k-均值算法通过迭代更新聚类中心和样本点所属聚类，其目标是最小化所有样本点到其所属聚类中心的距离平方和。

2. 初始设定

聚类数量：k = 2
样本点集合：X = {1, 2, 3, 4}
初始聚类中心：µ1 = 2，µ2 = 4

3. 第一次迭代

样本点分类：

x = 1：
∥1 - 2∥ = 1
∥1 - 4∥ = 3
根据打破平局规则，归为聚类 C1
x = 2：
∥2 - 2∥ = 0
∥2 - 4∥ = 2
归为聚类 C1
x = 3：
∥3 - 2∥ = 1
∥3 - 4∥ = 1
根据打破平局规则，归为聚类 C1
x = 4：
∥4 - 2∥ = 2
∥4 - 4∥ = 0
归为聚类 C2

当前聚类划分：

C1 = {1, 2, 3}
C2 = {4}

更新聚类中心：

µ1 = (1 + 2 + 3) / 3 = 2
µ2 = 4

4. 后续迭代

由于更新后的聚类中心与之前相同，算法收敛。

5. 分析是否为局部最小值

原聚类划分的目标函数值（G1）：

G1 = ∥1 - 2∥² + ∥2 - 2∥² + ∥3 - 2∥² + ∥4 - 4∥² = 2

新聚类划分的目标函数值（G2）：

C1 = {1, 2}，新的聚类中心为：(1 + 2) / 2 = 1.5
C2 = {3, 4}，新的聚类中心为：(3 + 4) / 2 = 3.5
G2 = ∥1 - 1.5∥² + ∥2 - 1.5∥² + ∥3 - 3.5∥² + ∥4 - 3.5∥² = 1

结论：

由于 G2 < G1，说明当前收敛点不是局部最小值。

<

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。