扩展Kmeans类型算法的研究与实验
1. 算法扩展介绍
在实际应用中,基本的kmeans和E - kmeans算法会平等对待所有特征,但不同特征的判别能力可能存在差异。基于此,有了一些算法的扩展。
1.1 E - Wkmeans算法
E - Wkmeans算法在更新特征权重时,能同时考虑数据集的离散程度以及聚类中心与全局中心的距离。设$W = {w_1, w_2, \cdots, w_m}$为$m$个特征的权重,$\beta$为调整权重$w_j$的参数,目标函数为:
[
P(U, W, Z) = \sum_{p = 1}^{k} \sum_{i = 1}^{n} u_{ip} \left[ \sum_{j = 1}^{m} w_{j}^{\beta} \frac{(x_{ij} - z_{pj})^2}{(z_{pj} - z_{0j})^2} \right]
]
约束条件为:
[
u_{ip} \in {0, 1}, \sum_{p = 1}^{k} u_{ip} = 1, \sum_{j = 1}^{m} w_{j} = 1, 0 \leq w_{j} \leq 1
]
通过迭代求解以下三个问题来最小化目标函数:
1. 问题P1 :固定$Z = \hat{Z}$和$W = \hat{W}$,求解简化问题$P(U, \hat{Z}, \hat{W})$。
[
u_{ip} =
\begin{cases}
1, & \text{if } \sum_{j = 1}^{m} w_{j}^{\beta} \
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



