机器学习与数据可视化综合指南
1. Scikit - learn 简介
Scikit - learn 支持大量的机器学习算法,涵盖线性回归、逻辑回归、kNN(K 近邻)、kMeans、决策树、随机森林、MLP(多层感知器)和 SVM(支持向量机)等。此外,它还支持降维技术(如 PCA 主成分分析)、“超参数”调整、数据缩放方法,适用于数据预处理、交叉验证等。机器学习代码示例常结合 Scikit - learn、NumPy、Pandas 和 Matplotlib。同时,Scikit - learn 提供了各种内置数据集,可进行可视化展示,下面将介绍其中的手写数字数据集和鸢尾花数据集。
1.1 手写数字数据集(Digits Dataset)
手写数字数据集包含 1797 个 8×8 的小图像,每个图像是一个手写数字,与 MNIST 数据集类似。以下是几个操作该数据集的代码示例:
1.1.1 打印数据集内容
from scikit - learn import datasets
# Load in the 'digits' data
digits = datasets.load_digits()
# Print the 'digits' data
print(digits)
运行上述代码,将输出数据集的详细信息,包括图像数据、目标标签等。
1.1.2 绘制单个数字图像
from sklearn.datasets import loa
超级会员免费看
订阅专栏 解锁全文
1万+

被折叠的 条评论
为什么被折叠?



