简单聚类算法 K-means实现

K-means算法中K指分成多少类,为数据挖掘十大算法之一。

  • 基本原理:在非监督学习(Unsupervised Learning)中,没有标签用来分类,此时应如何分类?

K-means算法是一种解决方案,此实例较为简单,提前声明数据集要分类的数目,即K值。以空间中K个点为中心进行聚类,对最靠近他们的对象归类,逐次更新各聚类中心的值,直到最后的聚类结果。

  • 算法描述:
    1. 适当选择k个类的初始中心,记为 c 
    2. 在第k次迭代中,对任意一个样本,计算到c中各个中心点的距离,将该样本归到距离最短的中心x所在的类。即 data[i,-1]=x
    3. 利用均值等方法更新该类的中心值
    4. 对于所有的聚类中心,进行2、3迭代更新后,若c值保持不变,则迭代结束
  • 示例:分类四个药物,特征值简单,只有2个

Object Feature 1:Weight Index Feature 2: pH
Medicine A 1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值