1. 代码
from sklearn.datasets import make_blobs#使用make_blobs进行knn分类
from sklearn.neighbors import KNeighborsClassifier#导入KNN分类器
import matplotlib.pyplot as plt#导入画图
from sklearn.model_selection import train_test_split#导入数据集拆分工具
data=make_blobs(n_samples=200,centers=2,random_state=8)
X,y=data
plt.scatter(X[:,0],X[:,1],c=y,cmap=plt.cm.spring,edgecolor='k')
plt.show()
2. 截图

3. 知识点
- scikit常用数据集数据加载工具
- scikit中的make_blobs方法常被用来生成聚类算法的测试数据,直观地说,make_blobs会根据用户指定的特征数量、中心点数量、范围等来生成几类数据,这些数据可用于测试聚类算法的效果。
sklearn.datasets.make_blobs(n_samples=100, n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0, 10.0), shuffle=True, random_state=None)


本文介绍了如何使用scikit-learn库的make_blobs方法生成聚类算法的测试数据,这些数据适用于评估K近邻(KNN)算法的效果。通过指定特征数量、中心点和数据范围,可以创建多类别数据集。
1288

被折叠的 条评论
为什么被折叠?



