0.2 Kmeans

最新推荐文章于 2024-10-15 20:30:54 发布

Plenari

最新推荐文章于 2024-10-15 20:30:54 发布

阅读量504

点赞数 5

CC 4.0 BY-SA版权

分类专栏： ML 文章标签： ML

本文链接：https://blog.youkuaiyun.com/qq_37991573/article/details/83513699

ML 专栏收录该内容

4 篇文章

订阅专栏

Kmeans

*　　kmeans算法过程描述如下所示：

1.创建k个点作为起始质心点，c1，c2，…，ck
2.重复以下过程直到收敛

遍历所有样本xi，根据距离确定每一个样本的类别。
确定类别后，计算每一个样本到各自质心的距离，然后求和。和用来和前一次计算出来的距离和比较，已确定是否收敛。
对每一个类，计算所有样本的均值并将其作为新的质心（对于点而言，就是所有x坐标的平均值作为质心的x坐标，所有
y坐标的平均值作为y坐标的均值）

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import datasets

datasets.make_blobs?

x,y=datasets.make_blobs(n_features=3,centers=3)

def init(x,centers=3,):
    '''
    根据x每一个特征的数值范围，产生centers个数据点：
    '''
    array=[]
    for i in x.T:
        maxx,minx=np.max(x),np.min(x)
        array.append(np.random.random(centers)*(maxx-minx)+minx)
    return np.array(array).T

def distance(x,k):
    '''
    几何距离,返回每一点的标签
    '''
    return np.argmin(np.array([np.sqrt(np.sum((x-i)**2,axis=1))for i in k]).T,axis=1)

k=init(x,centers=3)
plt.plot(x[:,0],x[:,1],'*')
plt.plot(k[:,0],k[:,1],'b*')
plt.show()

for i in range(10):
    '''
    计算新的k,循环
    '''
    k=np.array([np.mean(x[kinds==i],axis=0) for i in set(kinds)])
    kinds=distance(x,k) 
    #print(k.shape,len(set(kinds)))

plt.plot(x[:,0],x[:,1],'*')
plt.plot(k[:,0],k[:,1],'r*')
plt.show()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Plenari

关注关注

5
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

PCL Kmeans++点云聚类

点云侠的博客

01-10

2797

由于传统Kmeans算法是随机选取聚类中心点，可能会出现聚类失败的现象。因此对选点策略进行改进，使传统Kmeans算法进化为Kmeans++，从而使算法成功的概率大大提高。

KMeans文本聚类：将文本数据分组

AI天才研究院

05-20

1509

K-Means文本聚类：将文本数据分组作者：禅与计算机程序设计艺术 1. 背景介绍 1.1 文本聚类的重要性在当今大数据时代,海量的文本数据正以前所未有的速度增长。如何从这些文本数据中挖掘出有价值的信息,成为了一个

1 条评论您还未登录，请先登录后发表或查看评论

python中numpy.mean()函数，深度理解axis的含义

热门推荐

sinat_38857565的博客

07-04

2万+

numpy.mean()传送门 numpy.mean(a, axis=None, dtype=None, out=None, keepdims=) a：为array形的数据 axis：科普下，axis=0表示纵轴的方向，axis=1表示横轴的方向 1）axis为二维array时：axis可为0,1两个方向轴不填时默认为a全部元素的平均值 axis=0 表示纵轴平均，输出的是格式（1，x）的格式...

c++ KMeans

juluwangriyue的博客

02-28

955

c++ KMeans1、3D点聚类CodeCMakeLists.txt2、一般KMeans一、Kmeans算法二、K-均值聚类的一般流程三、算法设计和实现 1、3D点聚类 vtk-examples/Cxx/InfoVis/KMeansClustering Code KMeansClustering.cxx #include <vtkActor.h> #include <vtkDoubleArray.h> #include <vtkIntArray.h> #include

KMeans 聚类算法

weixin_37179744的博客

10-15

5837

目录0、环境准备1、聚类 vs 分类2、K-Means2.1、数据拟合和预测2.2、画出决策边界2.3、硬聚类 vs 软聚类2.4、K-Means 算法详解2.5、K-Means 易变性2.6、Inertia2.7、K-Means++2.8、K-Means 加速2.9、Mini-Batch K-Means2.10、如何确定最优的聚类数2.11、K-Means 的局限性在介绍 KMeans 文本聚类后，我们此篇内容对 KMeans 算法做进一步详细介绍。因关于 KMeans 等经典算法的介绍，无论是原.

Kmeans聚类

qq_51945465的博客

04-29

1708

KMeans聚类算法

Kmeans聚类分析

qq_51934529的博客

09-02

1万+

kmeans手工实现

qq_18668137的博客

04-09

1035

算法原理 kmeans的计算方法如下： 1 随机选取k个中心点 2 遍历所有数据，将每个数据划分到最近的中心点中 3 计算每个聚类的平均值，并作为新的中心点 4 重复N次，直到这k个中心点不再变化（收敛了），或执行了足够多的迭代代码实现： 1.首先定义一个聚类对象Cluster，里面包括了：（1）样本点对象samples，样本点维度对象n_dim，聚类中心对象centroid ...

KMeans算法

MrWanC的博客

04-28

1828

KMeans算法 from sklearn.datasets import make_blobs import matplotlib.pyplot as plt from sklearn.cluster import KMeans from sklearn.metrics import silhouette_score from sklearn.metrics import silhouette_...

kmeans算法

weixin_51589123的博客

11-02

7467

文章目录1、概述1.1 无监督学习与聚类算法1.2 sklearn中的聚类算法2、KMeans2.1 KMeans是如何工作的？2.2 簇内误差平方和的定义和解惑3、sklearn.cluster.KMeans3.1 重要参数n_clusters3.2 聚类算法的模型评估指标3.2.1当真实标签已知时3.2.2 当真实标签未知时：轮廓系数3.3案例：基于轮廓系数来选择n_clusters3.4 重要参数init & random_state & n_init：初始质心怎么放好?3.5 重要参

Kmeans实战

lhaniey的博客

05-16

1816

对20支球队进行聚类分析数据来源：https://github.com/cystanford/kmeans # -*- coding: utf-8 -*- """ Created on Thu May 16 10:05:27 2019 @author: Administrator """ from sklearn.cluster import KMeans from sklearn ...

kmeans算法中的sse_kmeans优化算法：二分Kmeans聚类算法

weixin_33680199的博客

02-26

744

算法的理解Bi这里是的意思就是Binary，二进制的意思，所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢，就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代的过程中消失的问题。BiKmeans只是Kmeans其中一个优化方案，其实还是有很多优化的方案，这里BiKmeans容易讲解和理解，并且容易用numpy, pandas实现。那为什么二...

机器学习篇-聚类Kmeans算法

m0_60916732的博客

10-15

1615

无监督学习算法，主要用于将相似的样本自动归到一个类别中；计算样本和样本之间的相似性，一般使用欧式距离误差平方和SSE (The sum of squares due to error)SSE 越小，表示数据点越接近它们的中心，聚类效果越好# @FileName : 03-顾客数据分析.pyimport osos.environ["OMP_NUM_THREADS"] = '1' # 解决内存泄露警告。

004、KMeans和DBSCAN的比较

Code is fun.

06-17

960

客户分群KMeans：适用于将客户分成明确数量的群体，适合电商、零售等行业的客户行为分析。DBSCAN：适用于发现不规则的客户群体，适合社交网络用户分析。地理数据聚类KMeans：适用于地理位置数据的简单聚类，如分区域的地理数据分析。DBSCAN：适用于识别地理数据中的聚集点和噪声，如城市中的人群热点区域识别。文本数据聚类KMeans：适用于将文本数据分成预先确定的主题群体，适合新闻分类等应用。DBSCAN：适用于发现文本数据中的不规则主题群体，适合社交媒体内容分析。图像处理KMeans。

一个基于Go开发的内网穿透工具.zip

最新发布

08-24

一个基于Go开发的内网穿透工具.zip

qpid-dispatch-router-1.19.0-1.el8.tar.gz

08-24

# 适用操作系统：Centos8 #Step1、解压 tar -zxvf xxx.el8.tar.gz #Step2、进入解压后的目录，执行安装 sudo rpm -ivh *.rpm

基于go开发的im系统.zip

08-24

基于go开发的im系统.zip

商用车P2并联混合动力系统HCU控制策略与模型构建详解

08-24

商用车P2并联混合动力系统的HCU（整车控制器）控制策略及其模型构建方法。首先探讨了模式切换策略，针对不同工况如车辆速度、电池状态等因素进行模式选择。接着深入解析了扭矩分配策略，考虑温度变化以及坡道情况对扭矩分配的影响。随后阐述了能量回收策略，利用滑动窗口预测算法提高能量回收效率。最后讨论了故障降级策略，确保系统在出现故障时能够快速响应。文中不仅提供了理论依据，还给出了具体代码实现。适合人群：从事汽车电子控制系统开发的技术人员，尤其是专注于混合动力系统的研究人员和技术爱好者。使用场景及目标：帮助开发者将规范文档转化为实际可用的模型，解决实际应用中的各种复杂工况问题，提升系统的稳定性和性能。其他说明：文章强调了在建模过程中需要灵活应对实际情况，避免机械地遵循规范文档，同时提出了建立规范追溯表来跟踪需求实现的有效做法。

汇川H3U标准程序：三轴定位与伺服控制的学习案例 · PLC编程

08-24

汇川H3U标准程序在工业控制系统中的应用，特别是三轴定位和伺服定位控制。文章首先概述了整个程序的模块化设计理念，强调了其结构清晰、易于理解和维护的特点。接着分别对脉冲轴控制、总线伺服控制进行了深入解析，展示了具体的代码实例及其应用场景。对于脉冲轴控制，文中提到使用PLS指令进行绝对/相对模式切换以及参数配置；而对于总线伺服，则利用SMC_SetOverride函数实现了实时调速功能。此外，文章还探讨了状态机设计用于回零操作的状态转换流程，以及数据隔离机制确保各轴之间的独立性。最后提到了报警处理模块的设计思路，通过将轴号嵌入错误码来快速定位故障源。同时简述了一些高级特性如MODBUS_TCP协议支持的远程调试接口和S型曲线算法的速度规划方法。适合人群：从事工业自动化领域的工程师和技术人员，尤其是那些希望深入了解汇川H3U PLC编程细节的人群。使用场景及目标：帮助读者掌握汇川H3U PLC在实际项目中的具体应用技巧，提高编程效率并优化系统性能。其他说明：建议读者结合实际硬件环境进行实验验证，以便更好地理解文中所介绍的技术要点。

改进kmeans自适应

03-08

### 改进 KMeans 算法以实现自适应聚类 #### 自适应模糊聚类算法一种有效的改进方式是引入模糊逻辑来增强传统 K-Means 的灵活性。该方法不仅考量了数据点间的欧氏距离，还综合评估了局部密度与整体分布特性[^1]。...