点击上方蓝色字体“州的先生”选择关注公众号
Python编程应用实战,尽在掌握
这是《Python AI极简入门》第5篇
零、前言
在上一篇,我们介绍了使用sklearn库快速创建一个用于预测房价的机器学习回归模型,并通过平均绝对误差、均方差和R3分数有效地评估了这个预测模型的效果。
在本篇,我们继续介绍借助sklearn库创建用于进行分类预测的机器学习模型。
对分类问题进行预测同样属于监督学习的范畴,通过对已知数据的类别的标记,来实现对未知数据的类别的预测和判定。
常见的应用领域包括:垃圾邮件识别、垃圾短信识别、图像分类识别等等。
常见的应用算法则有:SVM(支持向量机)、K紧邻、朴素贝叶斯、随机森林等等。
下面,我们就通过Digits手写数字集来进行机器学习分类模型的介绍。
一、初探手写数字数据集
本篇选用的手写数字数据集同样来自有sklearn.datasets子模块,其由著名的UCI 机器学习库提供:

该数据集由1797个8x8图像组成。每个图像,都是手写数字。
就像上一篇导入波士顿数据集一样,我们从sklearn模块中进行导入:

接着查看数据集中包含的子方法:

本文是《Python AI极简入门》系列的第五篇,介绍如何使用sklearn库创建图像分类模型,以Digits手写数字集为例,通过支持向量机、K近邻等算法进行图像识别。首先,导入数据集并展示图像,然后分割训练测试集,创建随机森林分类器进行训练,并使用精度分类评分、召回评分评估模型效果。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



