【机器学习】三、聚类算法原理

本文详细介绍了机器学习中的无监督学习方法——聚类算法,特别是K-means和层次聚类的基本原理。内容涵盖聚类算法思想、K-means算法流程、距离计算方法、K值选择策略、K-means局限性以及层次聚类的特点,并对比了两者之间的区别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一文详解,分类和回归树算法背后原理。码字不易,喜欢请点赞,谢谢!!!
机器学习包括有监督和无监督两种,而无监督中主要是聚类和降维算法。
对于聚类算法来说,最常用的是K-means算法和层次聚类方法,本文对这两种算法进行简答的介绍。
在这里插入图片描述
一、聚类算法的思想
聚类算法是将N个点聚到K个簇里面,聚类之后,类之间具有异质性,而同一类里面具有同质性。
二、K-means算法
K-means算法是聚类算法中最经典的算法,其思路如下:

  1. 确定聚类个数k
  2. 随机选取k个点作为初始中心点
  3. 将每个点分配到距离最近的中心点
  4. 对每个类中的数据使用均值更新中心点
  5. 重复操作3和4直到达到迭代次数或者损失函数不再减小

三、距离计算方法

  1. 最常用的欧氏距离
    在这里插入图片描述
    对于平面可分,一般采用欧氏距离来聚类在这里插入图片描述

  2. 曼哈顿距离:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值