sklearn.datasets.make_blobs 生成符合高斯分布的点

sklearn.datasets.make_blobs函数用于生成用于聚类的高斯分布点。它可以设置生成的样本数量、特征数、中心点数量和标准偏差。返回的数据包括样本特征矩阵X和对应的类别标签y。示例中展示了该函数在分类器概率校准的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

sklearn.datasets.make_blobs

sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=None, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)
生成用于聚类的各向同性高斯blobs

参数

n_samples : int或类似数组,可选(默认值= 100)
如果是int,则它是在簇之间平均分配的总点数。如果是类似数组,则序列的每个元素都表示每个簇的样本数。

n_features : int,optional(默认值= 2)
对于每一个样本,特征的数量。

centers : int 或者 array of shape [n_centers, n_features],可选
(默认=无)要生成的中心数或固定中心位置。如果n_samples为int且center为None,则生成3个中心。如果n_samples类似于数组,则center必须是None或长度等于n_samples长度的数组。

cluster_std : float或浮点序列,可选(默认值= 1.0)
簇的标准偏差。

center_box : 浮动对(最小值,最大值),可选(默认值=( - 10.0,10.0 ))
当中心随机生成时,每个聚类中心的边界框。
shuffle : boolean,optional(default = True)

random_state : int,RandomState实例或None(默认)
确定数据集创建的随机数生成。传递一个int,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值