22、一维 K-Means 与给定 J 中心问题的多项式可解性

一维 K-Means 与给定 J 中心问题的多项式可解性

1. 问题提出及相关背景

在聚类分析中,K-Means 问题是一个经典问题。给定一个在 d 维欧几里得空间中的 N 个点的集合 Y 和一个正整数 K,需要将集合 Y 划分为非空的簇 $C_1, \cdots, C_K$,使得以下求和最小:
[
\sum_{j = 1}^{K} \sum_{y \in C_k} |y - y(C_k)|^2
]
其中,$y(C_k) = \frac{1}{|C_k|} \sum_{y \in C_k} y$ 是第 k 个簇的质心。K-Means 问题也被称为最小平方和聚类(MSSC),在统计学领域早有研究。

近年来,有研究证明了 K-Means 问题是强 NP 难的。不过,在一维情况下,该问题具有多项式可解性。例如,Rao 在 1971 年提出了一个动态规划算法,其运行时间为 $O(KN^2)$。

本文研究的是一个与 K-Means 问题形式相近但研究较少的问题:

问题 1(K-Means 和给定 J 中心) :给定一个在 d 维欧几里得空间中的 N 个点的集合 Y、一个正整数 K 和一个点的元组 ${c_1, \cdots, c_J}$,需要将 Y 划分为非空的簇 $C_1, \cdots, C_K, D_1, \cdots, D_J$,使得:
[
F = \sum_{k = 1}^{K} \sum_{y \in C_k} |y - y(C_k)|^2 + \sum_{j = 1}^{J} \sum_{y \in D_j} |y - c_j|^2 \to \min

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值