一文详解,分类和回归树算法背后原理。码字不易,喜欢请点赞,谢谢!!!
机器学习包括有监督和无监督两种,而无监督中主要是聚类和降维算法。
对于聚类算法来说,最常用的是K-means算法和层次聚类方法,本文对这两种算法进行简答的介绍。
一、聚类算法的思想
聚类算法是将N个点聚到K个簇里面,聚类之后,类之间具有异质性,而同一类里面具有同质性。
二、K-means算法
K-means算法是聚类算法中最经典的算法,其思路如下:
- 确定聚类个数k
- 随机选取k个点作为初始中心点
- 将每个点分配到距离最近的中心点
- 对每个类中的数据使用均值更新中心点
- 重复操作3和4直到达到迭代次数或者损失函数不再减小
三、距离计算方法
-
最常用的欧氏距离:
对于平面可分,一般采用欧氏距离来聚类 -
曼哈顿距离: