17、证明 k - 均值算法可能收敛到一个并非局部最小值的点。假设 k = 2,样本点为 {1,2,3,4} ⊂R,在定义 Ci 时,通过将 i 赋值为 argmin j ∥x - µj∥ 中的最小值来打破平局。
k-均值算法收敛性分析
1. k-均值算法步骤
k-均值算法通过迭代更新聚类中心和样本点所属聚类,其目标是最小化所有样本点到其所属聚类中心的距离平方和。
2. 初始设定
- 聚类数量:k = 2
- 样本点集合:X = {1, 2, 3, 4}
- 初始聚类中心:µ1 = 2,µ2 = 4
3. 第一次迭代
样本点分类:
- x = 1:
- ∥1 - 2∥ = 1
- ∥1 - 4∥ = 3
- 根据打破平局规则,归为聚类 C1
- x = 2:
- ∥2 - 2∥ = 0
- ∥2 - 4∥ = 2
- 归为聚类 C1
- x = 3:
- ∥3 - 2∥ = 1
- ∥3 - 4∥ = 1
- 根据打破平局规则,归为聚类 C1
- x = 4:
- ∥4 - 2∥ = 2
- ∥4 - 4∥ = 0
- 归为聚类 C2
当前聚类划分:
- C1 = {1, 2, 3}
- C2 = {4}
更新聚类中心:
- µ1 = (1 + 2 + 3) / 3 = 2
- µ2 = 4
4. 后续迭代
由于更新后的聚类中心与之前相同,算法收敛。
5. 分析是否为局部最小值
原聚类划分的目标函数值(G1):
G1 = ∥1 - 2∥² + ∥2 - 2∥² + ∥3 - 2∥² + ∥4 - 4∥² = 2
新聚类划分的目标函数值(G2):
- C1 = {1, 2},新的聚类中心为:(1 + 2) / 2 = 1.5
- C2 = {3, 4},新的聚类中心为:(3 + 4) / 2 = 3.5
G2 = ∥1 - 1.5∥² + ∥2 - 1.5∥² + ∥3 - 3.5∥² + ∥4 - 3.5∥² = 1
结论:
由于 G2 < G1,说明当前收敛点不是局部最小值。
<
最低0.47元/天 解锁文章
580

被折叠的 条评论
为什么被折叠?



