K-Means聚类算法,KNN分类算法,AP聚类算法

本文介绍了三种常见的机器学习聚类算法:K-Means、KNN和AP算法。K-Means是无监督学习算法,需要预设K值,存在收敛到局部最优的问题。KNN是有监督学习算法,通过最近邻分类进行预测,K值的选择通过交叉验证确定。AP算法是一种基于消息传递的聚类方法,涉及吸引度和归属度的概念,其参考度和阻尼系数影响聚类结果和算法收敛。

1 K-Means

       说明:类别的个数是提前定义好的,属于无监督学习算法。

1.1 算法描述

  1. 输入数据和K值
  2. 随机生成K个点
  3. 对输入的数据,计算每个点属于哪一类
  4. 对于K个点,找出所有属于自己这一类的点,然后把坐标修改为这些点的中心
  5. 判断算法是否收敛,若没有收敛返会3,否则输出结果。判断收敛的条件是误差平方和,如以下公式:
    在这里插入图片描述
    当两次迭代J的差值小于某一阈值时,即ΔJ<δ时,则终止迭代

1.2 K值的选择

参考

1.3 K-means的缺点

  1. k的选取不好把握;
  2. 如果数据的类型不平衡,比如数据量严重失衡或者类别的方差不同,则聚类效果不佳;
  3. 采用的是迭代的方法,只能得到局部最优解;

2 KNN(K Nearest Neighbors)

       说明:属于有监督学习算法。
       KNN的原理就是当预测一个新的值x的时候,根据它距离最近的K个点是什么类别来判断x属于哪个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值