SGE日志分析聚类算法

最新推荐文章于 2025-06-11 22:01:58 发布

pingchuan2012

最新推荐文章于 2025-06-11 22:01:58 发布

阅读量908

点赞数

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/pingchuan2012/article/details/14165487

本文介绍了一种改进的KMeans算法，针对一维数据集进行了优化。该算法通过设置阈值和固定筛子的方式进行数据分配，计算平均值作为初始质心，然后迭代聚类直至满意度不再降低。此方法无需指定聚类数量，适用于不同密度的数据，通过合并簇内对象数较多的簇来减少簇的数量。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基于KMeans的改进算法（针对一维）：

【算法】

1.设定阈值，使用固定筛子的方式将对象分配到各个不同的“筛孔”里，并计算落入每个“筛孔”中的对象的平均值，即初始质心。

2.对步骤1中的初始质心进行类似步骤1方法的聚类，得到初始质心的聚类结果。

3.将步骤2中的初始质心聚类结果作为聚类的初始质心进行聚类，对于每个对象选择最近的质心，若到达每个质心的距离都超过设定的阈值，则创建新类。

4.计算满意度（越低越好），重复步骤2-3，获得新的满意度，如果满意度不再降低，则收敛。

【特点】

1.不需要指定目标聚类数目。

2.保证了每个簇的凝聚程度是比较好的，但是簇的个数比较多，而且无法应对不同密度的情况。

【衡量聚类结果】

1.按质心值排序，计算相邻值之差的绝对值，然后相加。

【改进】

1.将相邻的簇内对象数比较多的簇进行合并，从而减少簇的个数。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。