k-均值聚类

本文深入解析了KKK-均值聚类算法的工作原理,通过随机初始化聚类中心,运用EM算法迭代优化,实现数据点的最优分类。文章详细介绍了算法的四个步骤:随机化、E步、M步及循环收敛过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

k k k-均值聚类,就是利用每个样本到各个类中心的距离来判断属于哪个类,或者知道属于某个类别来求解中心。但是,这就陷入先有鸡还是先有蛋的问题,因为此问题有隐含变量,故可以用EM算法求解。

  • ① 随机化
    假设你想分成 k k k 类,那么可以随机化 μ 1 , μ 2 , ⋯   , μ k \mu_1,\mu_2,\cdots,\mu_k μ1,μ2,,μk
  • ② E-step
    Z i = arg min ⁡ k ∣ ∣ x i − μ k ∣ ∣ , i = 1 ∼ N Z_i=\argmin_k||x_i-\mu_k||,\quad i=1\sim N Zi=kargminxiμk,i=1N 此处很好理解,离谁进属于谁嘛
  • ③ M-step
    { N k = ∑ i = 1 N I ( Z i = k ) N 个 样 本 中 多 少 个 属 于 第 k 类 μ k = 1 N k ∑ i = 1 Z i = k x i μ k 是 第 k 类 样 本 均 值 \begin{cases} N_k=\displaystyle\sum_{i=1}^NI(Z_i=k)&N个样本中多少个属于第k类\\\\ \mu_k=\displaystyle\frac{1}{N_k}\sum_{i=1\atop Z_i=k}x_i&\mu_k是第k类样本均值 \end{cases} Nk=i=1NI(Zi=k)μk=Nk1Zi=ki=1xiNkμkk
  • ④跳到②,循环直至收敛
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值