《统计学习方法》第 14 章 聚类方法 KMeans

本文深入探讨了K-均值聚类算法的基本原理,包括如何将n个样本分配到k个不同的类中,使得每个样本到其所属类中心的距离最小。详细介绍了算法的策略、损失函数以及迭代过程,直至达到收敛。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

k-均值聚类

n 个样本分到 k 个不同的类或簇,每个样本到其所属类的中心的距离最小。

每个样本只能属于一个类,所有 k-均值聚类硬聚类

模型

  • k < n
  • G_{i} \cap G_{j} = \varnothing, \bigcup_{i=1}^{k}G_{i} = X

策略

  • 距离: 欧式距离
  • 损失函数:样本与所属类的中心的距离总保
  • NP 困难问题

算法

目标函数极小化

  1. 初始化,随机取 k 个样本做中心
  2. 对样本进行聚类,计算样本到类中心距离,每个样本指派到与其最近的中心的类
  3. 计算新的类中心。对聚类结果计算样本的均值,做为新的类中心
  4. 如果迭代收敛或符合停止条件,输出。否则,令 t = t + 1 ,返回 2

源码:github.com/iOSDevLog/s…

转载于:https://juejin.im/post/5cfe7baef265da1b6a348a19

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值