利用python实现聚类分析 - K-means

最新推荐文章于 2023-04-26 15:40:06 发布

原创

最新推荐文章于 2023-04-26 15:40:06 发布 · 7.3k 阅读

96 ·

CC 4.0 BY-SA版权

文章标签：

#算法 #python

本文深入浅出地介绍了K-means聚类算法的工作原理，包括如何通过迭代过程找到最优质心，以及算法的优缺点。同时，提供了详细的Python代码实现，演示了如何从随机生成的数据点中进行聚类。

K-means算法介绍

K-means算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。

算法过程如下：

1）从N个文档随机选取K个文档作为中心点；

2）对剩余的每个文档测量其到每个中心点的距离，并把它归到最近的质心的类；

3）重新计算已经得到的各个类的中心点；

4）迭代2～3步直至新的质心与原质心相等或小于指定阈值，算法结束。

算法优缺点：

优点：

原理简单
速度快
对大数据集有比较好的伸缩性

缺点：

需要指定聚类数量K
对异常值敏感
对初始值敏感

代码实现：

首先我们随机生成200个点，就取（0,2000）之间的，并确定质心个数，这里就取个3个质心，也是随机生成（可以根据需求改变）如下：

import random
import matplotlib.pyplot as plt

random_x = [random.randint(0,2000) for _ in range(200)]
random_y = [random.randint(0,2000) for _ in rang

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

橙序员一号

关注关注

10
点赞
踩
96

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Python实现K-means聚类分析

weixin_52398581的博客

12-30

4132

k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，其步骤是，预将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有（或最小数目）对象被重新分配给不同的聚类，没有（或最小数目）聚类中心再发生变...

K-means聚类分析（Python）

qq_43010742的博客

01-24

2567

解决将空间中一些点分成K类的问题，K 代表样本类别数 Kind推广到K就是：K均值聚类算法是先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有（或最小数目）对象给不同的聚类，没有（或最小数目）聚类中心再发生变化，误差平方和局部最小。

4 条评论您还未登录，请先登录后发表或查看评论

关于聚类问题的算法python代码实现-K-均值聚类方法

Sun123234的博客

06-25

9122

关于聚类问题的算法python代码实现-K-均值聚类方法

python数据分析 - 各种图

beishanyingluo的博客

03-08

2620

一折线图 1.1 import matplotlib.pyplot as plt #折线图：通过传入的数据，在二维坐标系下形成点，再将这些点连接成线 x = [1,5,4] #[x轴开始, x轴结束, x] y = [5,8,6] #[y轴开始, y轴结束, y] plt.plot(x,y) #三个节点[1, 5] [5, 8] [4, 6] plt.show() 1.2 import m...

python做聚类分析_Python聚类分析-摩拜用户群分类

weixin_39896256的博客

12-03

365

提到数据分析方法，可以分为三大类：回归分析、分类分析、聚类分析：回归分析：训练出已知的两个不同的数组间的函数关系，并作出预测；分类分析：从一组样本中，找出方法作出分类，并对未知参与训练的个体作出预测；聚类分析：对一组样本作出区分，成为探索几个簇间差异的依据。今天要分享的是聚类分析，分析摩拜用户的分类，数据源取自知乎友的网盘数据，有需要可以私信我。聚类分析的特点：1、是一种无监督的学习算法，没有严格...

Python实现聚类K-means算法

最新发布

10-11

Python聚类分析是数据挖掘中的一个核心领域，涉及到将数据集中的样本根据某种相似性度量划分到不同的类别或簇中。在Python中实现聚类分析，K-means和层次聚类是最常用也最基础的两种方法。 K-means算法是一种迭代...

精选资源

聚类分析-k-means聚类方法及其Python实现

03-25

聚类分析-k-means聚类方法及其Python实现

Python示例源码-数据分析-客户细分 —— k-means 聚类分析-大作业.zip

05-25

在数据分析领域，k-means算法是一种常用的无监督学习聚类算法，其主要目的是将样本数据点分成多个簇，使得同一个簇内的数据点相似度高，而不同簇内的数据点相似度低。这种算法在客户细分中尤为有用，可以基于客户的...

聚类 python_利用python进行聚类分析

weixin_39834090的博客

11-28

1057

XX平台搭建了线下门店和用户的桥梁。用户在平台上搜索满意的门店，然后到店消费。门店通过平台引流获取用户。平台通过团购的提点（类似于CPS）获得收入。三方均各取所需。商户是平台的收入来源方，为了健康地提升平台的收入。需要建立商户的价值评估模型，对商户进行分类，比较不同类别的商户价值，并制定相对应的策略。商户的价值模型分为两部分：商户本身的价值和商户给平台带来的价值。商户本身的价值用两个指标衡量：1）...

K-means聚类分析与python实现

12-12

K-means算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。本代码提供了k-means算法的python实现，并使用matlibplot可视化算法结果

Python——K-means聚类分析及其结果可视化

12-21

0 前言 K-Means是聚类算法的一种，通过距离来判断数据点间的相似度并据此对数据进行聚类。 1 聚类算法科学计算中的聚类方法方法名称参数可伸缩性用例几何形状（使用的指标） K-Means number of clusters Very large , medium with MiniBatch coden_samplesn_clusters General-purpose, even cluster size, flat geometry, not too many clusters Distances between poi

Python聚类分析

01-15

利用python进行聚类分析，适用于python3.7版本，经过实际例子验证。

python 代码实现k-means聚类分析的思路(不使用现成聚类库)

09-16

主要介绍了python 代码实现k-means聚类分析(不使用现成聚类库),本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下

Python使用K-means聚类分析

weixin_39559994的博客

01-22

3941

Python使用K-means聚类分析

python文本聚类分析_python机器学习kmeans算法——对文本进行聚类分析

weixin_39914975的博客

11-28

1241

#!/usr/bin/env python#-*- coding: utf-8 -*-#@File : kmeans.py#@Author: 田智凯#@Date : 2020/3/19#@Desc :机器学习kmeans算法，对科技成果项目进行聚类分析from __future__ importprint_functionimporttimefrom sklearn.feature_extr...

聚类 python_python中实现k-means聚类算法详解

weixin_39997443的博客

11-28

373

算法优缺点：优点：容易实现缺点：可能收敛到局部最小值，在大规模数据集上收敛较慢使用数据类型：数值型数据算法思想k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的，相近的就会放到同一个类别中去。1.首先我们需要选择一个k值，也就是我们希望把数据分成多少类，这里k值的选择对结果的影响很大，Ng的课说的选择方法有两种一种是elbow method，简单的说就是根据聚类的结果和k的...

python实现KMeans算法聚类分析

wangyoucaia的博客

04-26

2013

KMeans算法将数据集中的数据点随机生成 k 组,把每组的均值作为中心点。计算每个数据点与各组的中心点的相似性,根据数据点相似性的度量准则,把每个数据点重新分组,计算每组新的均值作为中心点。不断重复上述过程,直到中心点的均值收敛,停止迭代过程。

Python实现K-means聚类分析方法详解

尽管文件名中并未提及具体的使用场景，但可以推测文件内可能包含了一个或多个使用Python语言和`scikit-learn`库实现的K-means聚类分析实例。这些实例可能是为了帮助读者理解K-means算法的工作原理，或是针对特定数据...