层次聚类算法

层次聚类算法是一种不可逆的聚类方法,特点包括对噪音和异常点敏感,处理不同大小簇和非凸形状簇困难。主要的邻近度计算方法有最小距离、最大距离和组平均。最小距离对非椭圆形数据敏感但易受噪声影响;最大距离对噪声不敏感,适合大簇划分;组平均则在两者之间,对噪声影响较小。实例中通过欧几里得距离和不同邻近度量进行了聚类操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

算法描述

输入:包含n个对象的数据集
输出:簇的分层结构
算法步骤:
计算邻近度矩阵
每个点作为一个簇
Repeat
    合并最接近的两个簇
    更新邻近度矩阵
Until 仅剩下一个簇

这里写图片描述

特点

  • 如果两个类被合并,那么将不能被恢复
  • 不同的聚类模式都有以下一个或多个问题:
    1.对噪音和异常点敏感
    2.处理不同大小的簇和凸起的形状的簇比较困难
    3.分割大的类

层次关键的操作是计算两个簇之间的邻近度

邻近度

这里写图片描述

最小距离

  • 擅长处理非椭圆形数据
  • 对噪声点异常敏感

最大距离

  • 对噪声和异常点不敏感
  • 倾向于划分大的簇
  • 对球形的数据聚类误差明显

组平局

  • 介于单链和全链 </
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值