sklearn.datasets.make_blobs
sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=None, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)
生成用于聚类的各向同性高斯blobs
参数
n_samples : int或类似数组,可选(默认值= 100)
如果是int,则它是在簇之间平均分配的总点数。如果是类似数组,则序列的每个元素都表示每个簇的样本数。
n_features : int,optional(默认值= 2)
对于每一个样本,特征的数量。
centers : int 或者 array of shape [n_centers, n_features],可选
(默认=无)要生成的中心数或固定中心位置。如果n_samples为int且center为None,则生成3个中心。如果n_samples类似于数组,则center必须是None或长度等于n_samples长度的数组。
cluster_std : float或浮点序列,可选(默认值= 1.0)
簇的标准偏差。
center_box : 浮动对(最小值,最大值),可选(默认值=( - 10.0,10.0 ))
当中心随机生成时,每个聚类中心的边界框。
shuffle : boolean,optional(default = True)
random_state : int,RandomState实例或None(默认)
确定数据集创建的随机数生成。传递一个int,