k均值:
优点:1,简单,易于理解和实现;2,时间复杂度低
缺点:1,需要对均值给出定义,2,需要指定要聚类的数目;3,一些过大的异常值会带来很大影响;4,算法对初始选值敏感;5,适合球形聚类
层次聚类:
优点:1,距离和规则的相似度容易定义,限制少;2,不需要预先制定聚类数;3,可以发现类的层次关系;4,可以聚类成其它形状
缺点:1,计算复杂度太高;2,奇异值也能产生很大影响;3,算法很可能聚类成链状
本文对比了K均值聚类和层次聚类两种算法的特点。K均值聚类算法简单易实现,时间复杂度低,但对初始值敏感且不适合非球形分布的数据集。层次聚类则能自动发现数据的层次结构,适用于各种形状的聚类,但计算成本较高。
k均值:
优点:1,简单,易于理解和实现;2,时间复杂度低
缺点:1,需要对均值给出定义,2,需要指定要聚类的数目;3,一些过大的异常值会带来很大影响;4,算法对初始选值敏感;5,适合球形聚类
层次聚类:
优点:1,距离和规则的相似度容易定义,限制少;2,不需要预先制定聚类数;3,可以发现类的层次关系;4,可以聚类成其它形状
缺点:1,计算复杂度太高;2,奇异值也能产生很大影响;3,算法很可能聚类成链状
1117
1305
1万+

被折叠的 条评论
为什么被折叠?