K-Means聚类:基于非凸优化的全局搜索算法
在数据科学和机器学习领域,聚类分析是一项重要的任务,其中K-Means聚类是最常用的方法之一。然而,传统的K-Means算法往往陷入局部最优解,无法找到全局最优解。本文将介绍一种基于非凸优化的全局搜索算法,以解决K-Means聚类问题。
1. 目标函数的DC表示
为了应用A.S. Strekalovsky开发的DC最小化全局搜索理论,我们需要对非凸目标函数进行明确的DC表示。DC表示不是唯一的,我们将问题(5)的目标函数表示为两个凸函数的差:
[f(x, y) = g(x, y) - h(x, y)]
其中,
[g(x, y) = \sum_{i=1}^{k} \sum_{j=1}^{m} (d_1 |y_j - a_i|^2 + d_2 x_{ij}^2)]
[h(x, y) = \sum_{i=1}^{k} \sum_{j=1}^{m} (d_1 |y_j - a_i|^2 + d_2 x_{ij}^2 - x_{ij} |y_j - a_i|^2)]
这里,$d_1, d_2 > 0$是常数。
很明显,函数$g(\cdot)$是凸函数。为了证明函数$h(\cdot)$的凸性,我们固定$i$和$j$,引入向量$v \in \mathbb{R}^{n+1}$,并考虑函数$h(\cdot)$中的$ij$项:
[\varphi(v) = d_1 |v - a| n^2 + d_2 v {n+1}^2 - v_{n+1} |v - a| n^2 = d_2 v {n+1}^2 + (d_1 - v_{n+1}) \sum_{l=
超级会员免费看
订阅专栏 解锁全文
1465

被折叠的 条评论
为什么被折叠?



