聚类分析:从理论到实践的深入探索
1. 离散聚类问题算法
离散聚类问题旨在将一组对象划分为指定数量的簇。以下是解决该问题的算法步骤:
1. 枚举超平面集合 :给定待聚类对象集合 (X = {x_1, \ldots, x_m} \subseteq R^n) 和簇的数量 (k),枚举所有包含 (S) 中 (n) 个仿射独立点的超平面集合。
2. 检查超平面确定的单元 :确保这些超平面能够确定 (k) 个单元。
3. 分配点到单元 :对于位于超平面上的每个点,从 (2^t n) 种选择中确定其所属的单元,从而定义 (X) 的唯一划分。
4. 计算质心和误差 :找到划分中每个块的质心,并计算平方误差和 (sse(\pi))。
2. 聚类与矩阵奇异值分解
2.1 质心矩阵与平方误差和
设 (\kappa = {C_1, \ldots, C_k}) 是有限子集 (X = {x_1, x_2, \ldots, x_m} \subseteq R^n) 的一个划分,(c_i) 是 (x_i) 所属簇的质心,则质心矩阵 (C = (c_1 c_2 \cdots c_m) \in R^{n\times m})。假设 (rank(C) = k)((k \leq \min{n, m})),平方误差和 (sse(\kappa)) 可以表示为:
[sse(\kappa) = \sum_{i=1}^{m} |x_i - c_i|^2 = |A - C|_F^2]
其中 (A
超级会员免费看
订阅专栏 解锁全文
35

被折叠的 条评论
为什么被折叠?



