文章目录 MNIST 数据集 sklearn 加载的数据集通常具有类似字典结构 训练一个二元分类器 性能考核 混淆矩阵 精度 / 召回率权衡 ROC 曲线 多类别分类器 solution one solutin two 多标签分类 MNIST 数据集 一组有美国高中生和人口调查局员工手写的 70 000 个数字的图片 每张图片都用其代表的数字标记 机器学习领域的 “hello world” ,广泛使用于分类算法 # sklearn 提供 datasets 功能来下载流行的数据集 from sklearn.datasets import fetch_openml mnist = fetch_openml("mnist_784") sklearn 加载的数据集通常具有类似字典结构 DESCR 键,描述数据集 data 键,包含一个数组,每个实例为一行,每一特征为