曾梦想执剑走天涯,我是程序猿【AK】
目录
简述概要
了解无监督学习之聚类
知识图谱
无监督学习中的聚类是一种将数据集中的对象分组的算法,使得同一组(簇)内的对象比其他组的对象更相似。聚类的目标是发现数据中的内在结构,而不是基于预先定义的标签。以下是几种常见的聚类算法及其原理:
1. K-Means聚类
K-Means是最常用的聚类算法之一。它的目标是将数据点划分为K个簇,使得每个簇内的点之间的距离尽可能小,而簇间的距离尽可能大。
-
算法步骤:
- 随机选择K个数据点作为初始的簇中心(质心)。
- 将每个数据点分配给最近的簇中心,形成K个簇。
- 重新计算每个簇的质心,即簇内所有点的均值。
- 重复步骤2和3,直到簇中心不再发生变化或达到预定的迭代次数。
-
优点:简单、易于实现,计算效率相对较高。
-
缺点:需要预先指定K值,对初始质心