《Python机器学习基础教程》第5讲:聚类算法:让计算机帮我们分组

聚类算法是无监督学习里的“分类大师”,它的任务是把数据分成不同的组,每个组里的数据点都很相似,而不同组之间的数据点则不太一样。想象一下,你有一堆照片,里面有各种各样的动物,你希望计算机能帮你把这些照片分成“猫的照片”和“狗的照片”。这就是聚类算法的任务。听起来是不是很酷?


1. 聚类算法:让计算机自己分组

聚类算法就像是给计算机一堆没有标签的数据,然后让计算机自己去发现这些数据里有哪些“同类项”。比如,你有一堆客户数据,你想知道这些客户可以分成哪些不同的群体,比如“爱买书的人”和“爱买电子产品的人”。聚类算法就能帮你做到这一点。

聚类算法有很多种,今天我们主要介绍三种常用的聚类算法:k均值聚类、凝聚聚类和DBSCAN。


2. k均值聚类:最简单的聚类算法

k均值聚类是聚类算法里的“入门款”,它非常简单,但也很实用。想象一下,你有一堆点,你想把这些点分成k个组。k均值聚类会先随机选择k个点作为“簇中心”,然后把每个点分配到离它最近的簇中心。接着,它会重新计算每个簇的中心,再把点重新分配到最近的簇中心。这个过程会一直重复,直到簇中心不再变化。

例如你有一堆二维数据点,你想把这些点分成3个组。

import numpy as np
import matplotlib.pyplot as plt
fr
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

earthzhang2021

你的鼓励是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值