Boosting集合算法详解(一)

本文详细介绍了K-means算法,包括算法步骤、距离度量、变量标准化、质心的目标函数选择、时间复杂性和空间复杂性,以及处理空簇、离群点和其他问题的方法。此外,还探讨了二分K-means及其优缺点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文是关于聚类算法的第二篇K-means,感兴趣的同学可以前往http://ihoge.cn/2018/clustering.html
阅读完整版。

二、K-means

1. 算法步骤

<1> 选择 K K 个点作为初始质心
<2> Repeat:
<3> 将每个点指派到最近的质心,形成 K 个簇
<4> 重新计算每个簇的质心
<5> Until: 质心不发生变化终止

2. 距离的度量

闵可夫斯基距离

闵可夫斯基距离不是一种距离,而是一类距离的定义。对于 n 维空间中的两个点 x(x1,x2,x3,...,xn) x ( x 1 , x 2 , x 3 , . . . , x n ) y(y1,y2,y3,...,yn) y ( y 1 , y 2 , y 3 , . . . , y n ) ,那么 x x y 亮点之间的闵可夫斯基距离为:

dxy=i=1n(xiyi)p d x y = ∑ i = 1 n ( x i − y i ) p

其中p是一个可变参数:

  • 当p=1时,被称为曼哈顿距离
  • 当p=2时,被称为欧式距离
  • 当p= 时,被称为切比雪夫距离。

余弦相似度

cos(Θ)=aT
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值