13、聚类算法：原理、应用与实践

study

于 2025-11-25 15:30:19 发布

阅读量5

点赞数

CC 4.0 BY-SA版权

分类专栏： MATLAB模式识别实战文章标签：聚类算法无监督学习 k-means

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/study/article/details/155291719

MATLAB模式识别实战专栏收录该内容

15 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

聚类算法：原理、应用与实践

1. 聚类简介

在许多模式识别问题中，我们之前处理的是有监督的情况，即每个训练模式的类别标签是已知的。但在聚类问题中，我们面临的是无监督的情况，没有这些类别标签信息。聚类的目标是将可用的模式划分为“合理”的组（簇），以提取模式之间相似性或差异性的有用信息。

2. 基本概念与定义

模式表示 ：每个训练模式由一组 $l$ 个特征表示，形成一个 $l$ 维向量 $x = [x(1),…,x(l)]^T$。因此，每个训练模式对应于 $l$ 维空间中的一个点（向量）。
聚类定义 ：给定一组数据向量 $X = {x_1,…,x_N}$，将它们分组，使得“更相似”的向量在同一簇中，“不太相似”的向量在不同簇中。包含这些簇的集合 $\Re$ 称为 $X$ 的一个聚类。

例如，考虑一些数据向量，可能有不同的聚类方式，如 $\Re_1 = { {x_1, x_2},{x_3, x_4},{x_5, x_6, x_7}}$ 和 $\Re_2 = { {x_1, x_2, x_3, x_4},{x_5, x_6, x_7}}$ 都是合理的聚类，因为彼此靠近的向量被包含在同一簇中。但没有额外的数据信息来指示最终应选择哪一个，通常在处理聚类问题时，最好咨询应用领域的专家。

聚类的特点
- 定义的模糊性 ：聚类没有严格的定义，因为缺乏外部信息（类别标签），“相似

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。