[模式识别].(希腊)西奥多里蒂斯<第四版>笔记11之__聚类:基本概念

本文探讨了非监督聚类的基本概念与应用,包括聚类的五个主要步骤:特征选择、相似性度量、聚类标准、聚类算法及结果验证。文中还介绍了不同类型的相似性度量方法,如点间度量、点与数据集间度量及数据集间度量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一,引言

之前几个章节讨论的都是监督聚类,从本章开始讨论非监督聚类,即训练模式不带标签的情形。


    聚类的步骤:

1,特征选择。选取最能够表示我们目标物体信息的特征。

2,相似性度量。给出两个特征量相似点或者不想似的地方。

3,聚类标准。聚类标准。可能由损耗函数(cost function)或者其他形式表达。

4,聚类算法。根据相似性度量和聚类标准,阐明数据的结构。

5,结果验证。

6,解释结果。

 

不同的特征、相似性度量、聚类标准和聚类算法会导致完全不同的结果。

主观性会一直伴随我们。(Subjectivity is a reality we have to live with from now on.)

 

聚类的应用:

1,数据简化。

2,提出假设。

3,验证假设。

4,基于组群的预测。

 

二,相似性度量

1,点间度量

2,点和数据集间度量

3,数据集间度量

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值