文本聚类与视觉跟踪技术研究
在数据处理和计算机视觉领域,文本聚类和视觉跟踪是两个重要的研究方向。下面将详细介绍文本聚类中的K-Means优化方法,以及基于迭代稀疏逼近的视觉跟踪新算法。
文本聚类:K-Means优化方法
在文本聚类任务中,为了提高聚类效果,研究人员尝试将背景知识以层次结构的形式融入,从而从一组文档中生成不同的聚类结果。研究对比了基于CCAG预处理、DPTC和SiVeR的K-Means算法。评估结果显示,基于CCAG预处理的K-Means算法表现最佳,在轮廓系数方面优于对比基线和基于DPTC的K-Means算法。而基于SiVeR的K-Means算法由于需要处理过多维度,其轮廓系数总是接近0,表明无法找到合理的聚类结构。
接下来,研究探索了CCAG和DPTC在改变特征数量和聚类数量时的表现。在固定聚类数量k = 10的情况下,观察特征数量与预处理方法之间的依赖关系。结果表明,随着维度的增加,DPTC和CCAG的聚类结果质量都会下降,但CCAG仍然比DPTC表现更好。
在实际应用中,考虑用户观点来确定维度数量是很有用的。一般来说,当使用超过6个维度时,轮廓系数会下降到0.25以下,这意味着使用更多维度可能无法发现有意义的聚类结构。
| 方法 | 优点 | 缺点 |
|---|---|---|
| 基于CCAG预处理的K-Means | 聚类效果好,在轮廓系数评估中表现优 | 未对算法1进行充分优化以消除最差结果 |
文本聚类与视觉跟踪研究
超级会员免费看
订阅专栏 解锁全文
7万+

被折叠的 条评论
为什么被折叠?



