可分实例的Bregman聚类:原理与应用
1. 引言
在聚类分析领域,Bregman k - 中位数问题是一个重要的研究方向。对于可分输入实例,我们可以通过特定的方法来近似求解该问题。当输入实例大小为 (|P| = n) 时,通过独立计算 bregmeans++ 种子 (2^{O(k)}) 次并选择最优的中心集,能够以任意高的概率得到 k - 中位数问题的常数因子近似解。这个过程最多使用 (2^{O(k)}n) 次算术运算,包括对 (D_{\varphi}) 的评估。虽然少量的 Lloyd 迭代可以显著提高解的质量,但目前还没有关于这种改进的近似保证,而理论上可证明的近似因子已经适用于种子步骤计算的解。
2. 预备知识
2.1 Bregman k - 中位数聚类
Bregman 散度是一种衡量差异的度量,由 Lev M. Bregman 在 1967 年引入。直观上,Bregman 散度可以看作是用切超平面近似凸函数时的误差。其正式定义如下:
设 (X \subseteq \mathbb{R}^d) 是凸集,对于任何严格凸且可微的函数 (\varphi: X \to \mathbb{R}),我们定义关于 (\varphi) 的 Bregman 散度为:
[D_{\varphi}(p, q) = \varphi(p) - \varphi(q) - \nabla\varphi(q)^{\top}(p - q)]
其中 (p, q \in X),(\nabla\varphi(q)) 表示 (\varphi) 在点 (q) 处的梯度。
Bregman 散度包含许多著名的差异度量,如下表所示:
| 散度
超级会员免费看
订阅专栏 解锁全文
1931

被折叠的 条评论
为什么被折叠?



