探索星型聚类中寻找星中心的多种方法
在星型聚类中,选择星中心的指标一直是一个关键问题。传统方法使用的指标可能并非最优,为了改进这一情况,我们提出了多种新的指标,并对不同指标下的离线星型、扩展受限和不受限星型以及在线星型算法的性能进行了实证研究。
新指标的提出
Aslam等人在推导星型聚类中卫星顶点之间的预期相似度时,得出了两个卫星顶点 (v_i) 和 (v_j) 之间相似度 (cos(\gamma_{i,j})) 的不等式:
[cos(\gamma_{i,j}) \geq cos(\alpha_i) cos(\alpha_j)+ (\frac{\sigma}{\sigma + 1}) sin(\alpha_i) sin(\alpha_j)]
其中,(cos(\alpha_i)) 是星中心 (v) 与卫星 (v_i) 的相似度,(cos(\alpha_j)) 是星中心 (v) 与卫星 (v_j) 的相似度。基于此,我们推导出了以下几种新的指标:
1. 下界指标(Lower Bound,lb(v)) :
[lb(v) = \frac{(\sum_{v_i \in v.adj} cos(\alpha_i))^2 + (\frac{\sigma}{\sigma + 1}) (\sum_{v_i \in v.adj} sin(\alpha_i))^2}{n^2}]
该指标是实际平均簇内相似度的理论下界,但计算成本较高,因为它同时使用了余弦和正弦函数。
2. 平均指标(Average,ave(v)) :
[ave(v) = \frac{\sum_{\forall v_
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



