(python)几种方法的训练和对比

本文对比了Python中k均值、觉知漂移、高斯混合和层次(Ward链接)四种聚类算法。通过创建测试数据集并应用这些算法,结果显示高斯混合模型在数据分布匹配时展现出最佳的鲁棒性和聚类效果,而k均值和层次算法在某些情况下可能会将数据点错误分类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

几种方法的训练和对比

概述

聚类算法,将数据重组为按某种方式排列的多个子集,以便从数据中推断出有意义的结构。
根据处理数据时所使用的度量方法或作出的假设,我们可以将聚类算法分成不同的种类。
这次我们python测试的为:k均值,觉知漂移,高斯混合,层次算法(Ward链接)

测试数据集

我们生成一个数据集,用于比较几种聚类方法。
我们从均值为u1=[10,0],u2=[0,10],方差为δ1=δ2=[[3,1],[1,4]]的两个二维正态分布,随机选取数据点形成数据集

python代码为:

from matplotlib import pyplot as plt
import numpy as np
np.random.seed(4711) # for repeatability
c1=np.random.multivariate_normal([10,0],[[3,1],[1,4]],size=[100,])
l1=np.zeros(100)
l2=np.ones(100)
c2=np.random.multivariate_normal([0,10],[[3,1],[1,4]],size=[100,])
#add noise:
np.random.seed(1) # for repeatability
noiselx=np.random.normal(0,2,100)
noisely=np.random.normal(0,8,100)
noise2=np.random.normal(0,8,100)
c1[:,0]+=noiselx
c1[:,1]+=noisely
c2[:,1]+=noise2

fig=plt.figure(figsize=(20,15))
ax=fig.a
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值