原型聚类算法

本文介绍了K均值算法、学习向量量化(VQ)及高斯混合聚类三种聚类算法的基本步骤。K均值算法通过迭代计算样本与原型向量间的距离实现样本聚类;学习向量量化适用于带标签的数据集,通过比较样本标签与原型向量标签调整原型向量;高斯混合聚类则使用概率模型来表达聚类模型。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、K均值算法

       step1:从样本中选取k个样本作为原型向量(\mu 1,\mu 2......\mu k

      Repeat:

       step2:分别计算样本xj与每个原型向量\mu i之间的距离dji,样本xj与哪个向量之间的距离最短,就把该样本归为该原型向量所在的簇,对每一个样本都需要进行归簇过程。

      step3:step2完成之后,所有的样本都归为某一簇中,此时再分别计算每一簇中的样本均值向量\mu i',并更新每一簇样本中的均值向量。

      Until  当前均值向量均不再需要更新

 

2、学习向量量化(VCQ)

     假设数据样本带有标签

      step 1:从样本随机选取k个样本作为原型向量(p1,p2......pk),对应的簇标记为(t1,t2......tk)

      Repeat:

      step 2:随机选取一个样本(xj,yj),找到 xj 与 k 个原型向量之间距离最短的向量 pj,相应的簇标记为 tj

                  如果:  xj的标签yj等于tj ,   则:pj'=pj+\eta *(xj-pj)

                 如果:  xj的标签yj不等于tj ,  则:pj'=pj-\eta*(xj-pj)

                 每次更新一个pj向量

      Util     满足停止条件      、

          

3、高斯混合聚类

    高斯混合聚类采用概率模型来表达聚类模型

    step 1:初始化概率高斯混合分布的参数\left ( \alpha i,\mu i , \delta i)(i=1,2,.......k)

   Repeat:

    step 2: 

     对每一个样本xj均要计算其由各混合成分生成的后验概率,即 \gamma ji=p(zj=i/xj),然后根据公式更新每个高斯成分对应的参数 \left ( \alpha i‘’,\mu i’ , \delta i‘’)(i=1,2,.......k) 。

     Until   满足停止条件

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值