文章作者:Tyan
博客:noahsnail.com | 优快云 | 简书
本文主要是演示scikit-learn自带的数据集的一些用法。本文介绍两种sklearn构建数据集的方式,一种是直接加载已有的数据集,另一种是通过工具构建一个数据集。
- Demo
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.linear_model import LinearRegression
# 直接加载数据集
loaded_data = datasets.load_boston()
data_X = loaded_data.data
data_y = loaded_data.target
# 定义模型
model = LinearRegression()
# 学习参数
model.fit(data_X, data_y)
# 计算预测值
result = model.predict(data_X)
# 创造一些线性回归的数据点
X, y = datasets.make_regression(n_samples = 100, n_features = 1, n_targets = 1, noise = 5)
# 绘制创造的数据集的散点图
plt.scatter(X, y)
plt.show()
- 结果
[ 30.00821269 25.0298606 30.5702317 28.60814055]
[ 24. 21.6 34.7 33.4]


本文通过实例展示了scikit-learn中数据集的使用方法,包括直接加载现有数据集和构建自定义数据集的过程,并提供了线性回归模型训练及可视化结果。
2866

被折叠的 条评论
为什么被折叠?



