Python中生成随机数据集的两种方法

本文介绍两种生成数据集的方法,一种是使用SciPy随机生成数据点,另一种是利用sklearn生成具有一定类特征的数据集,适用于聚类分析。通过Python代码演示了如何生成数据并使用Matplotlib进行可视化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  • 第一种方法
from scipy import *
import pylab as pl
 
all_points = rand(500, 2)# 第一个参数表示随机生成数据点的数目,第二个参数表示数据点是一个具有二维特征的
pl.plot(all_points[:, 0], all_points[:, 1], 'b.')# 绘制出这些数据点,以点的形式
pl.show()

在jupyter 中运输代码输出结果如下:
在这里插入图片描述

  • 第二方式:常用来生成具有一定类特征的数据集,即可以用于聚类的数据集
import matplotlib.pyplot as plt
from sklearn.cluster import MiniBatchKMeans, KMeans
from sklearn import metrics
from sklearn.datasets.samples_generator import make_blobs

# 生成数据集
x, y = make_blobs(n_samples=400, n_features=2, centers=[[-1, -1], [0, 0], [1, 1], [2, 2]],
                  cluster_std=[0.4, 0.2, 0.2, 0.2])
# 生成数据散点图
plt.scatter(x[:, 0], x[:, 1], marker='o')
plt.show()

在jupyter 中运输代码输出结果如下:
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值