聚类
聚类任务
目标:将数据样本划分为若干个通常不相交的“簇”
聚类任务既可以作为一个单独过程(用于找寻数据内在的分布结构)
也可以作为分类等其他学习任务的前驱过程。
性能度量
聚类性能度量,亦称聚类“有效性指标”
外部指标
将聚类结果与某个“参考模型”进行比较
内部指标
直接考察聚类结果而不用任何参考模型
距离计算
距离度量需满足的基本性质
- 常见聚类方法
- 原型聚类
- 原型聚类
- 亦称“基于原型的聚类”
目标:将数据样本划分为若干个通常不相交的“簇”
聚类任务既可以作为一个单独过程(用于找寻数据内在的分布结构)
也可以作为分类等其他学习任务的前驱过程。
聚类性能度量,亦称聚类“有效性指标”
外部指标
将聚类结果与某个“参考模型”进行比较
内部指标
直接考察聚类结果而不用任何参考模型
距离度量需满足的基本性质