聚类分析(三) 层次聚类及matlab程序

本文介绍了层次聚类的基本概念,包括从下到上的凝聚算法及其主要步骤,如选择变量、计算样本间距离,并详细阐述了类间聚合的六种方式。此外,还提供了MATLAB中clusterdata函数的使用说明,用于执行聚类操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、层次聚类介绍
1.1 简介
层次聚类,主要是对给定的待聚类的数据集进行层次化分解。主要分为两大类:
1.从下到上的凝聚聚类
2.从上到下的分裂聚类
其他算法大部分是对样本之间距离度量或者类间凝聚/分裂依据进行改进。
1.2从下到上的凝聚算法
从下到上的凝聚算法能够让人们较为直观的观察到凝聚的树结构,也是层次聚类中比较常用的一个方法。
主要过程如下图所示。在这里插入图片描述

其中需要的步骤主要有三步:
1.选择变量
选择需要聚类的样本,就是需要聚类的数据集
2.计算样本之间的距离/相似度
关于样本距离的选择如果是空间变量,变量之间没有相互关系,一般选择欧式距离
如果样本之间存在物理上的关联,比如下一样本的产生与上一样本具有相同的物理原理,一般选择相似度。
将每个样本看成一个簇,计算每一类(样本)与其他类(样本)之间的相似度/距离,将样本距离按从小到大进行排序,按照从距离/相似度距离进行不断连接。
在这里插入图片描述
很明显黄点与紫色点聚为一类,然后可以得到6类,如下图所示,然后计算样本距离。
在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值