【从零开始学机器学习第 04 篇】
摘要:理解 Sklearn 的 model.score 和 accuracy_score 函数。
上一篇文章我们手写了划分数据集的函数,把 178 个葡萄酒数据集划分成了 124 个训练样本和 54 个测试样本。
Sklearn 划分训练集和测试集(可点击)
数据准备好之后,我们下面就使用 kNN 模型来训练这份数据集,最后通过模型得分来评价分类效果。
调用 Sklearn 中的模型得分库
先来调用 Skearn 中的 kNN 模型计算模型得分:

只需要几行代码, Sklearn 就训练好了 kNN模型,并且给出了 0.76 的模型得分。也就是说这个 kNN 模型在 54 个红酒样本测试集上,正确分类出了 76% 的样本,剩下 24% 则预测错了,结果不坏但也算不上好。可以进一步优化模型,之后的文章我们再讲。
现在我们想搞明白 Sklearn 如何计算模型得分的。