sklearn.datasets.make_blobs的使用

本文介绍了sklearn.datasets.make_blobs模块,用于生成带标签的聚类数据。该模块可以设置样本数量、特征维度、中心点、标准差等参数,适用于聚类算法的测试和演示。实例展示了如何使用该函数创建数据集。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

sklearn中的make_blobs模块用于为聚类生成一些带标签的数据

sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=None, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)

参数解释:

  • n_samples:表示的是样本点的个数,默认是100。如果其为类数组型值,则序列中的每个元素表示每个集群的样本数。
  • n_features:表示数据的维度,默认值是2。
  • centers:产生数据的中心点,默认值为3。centers等于几,所产生数据的类别就有几类。
  • cluster_std:数据集的标准差,浮点数或者浮点数序列,默认值1.0。
  • center_box:中心确定之后的数据边界,默认值(-10.0, 10.0)。
  • shuffle:洗乱,默认值是True。
  • random_state:官网解释是随机生成器的种子。

实例:

# 导入模块
from sklearn.datasets.samples_generator import make_blobs
# 生成了一个具有50个样本点,分为两类的带有标签y的二维数据集。
X
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值