译文地址:http://www.atyun.com/14092.html
源码地址:
https://github.com/susanli2016/Machine-Learning-with-Python/blob/master/Solving%20A%20Simple%20Classification%20Problem%20with%20Python.ipynb
数据集:
https://github.com/susanli2016/Machine-Learning-with-Python/blob/master/fruit_data_with_colors.txt
简单机器学习案例.几乎照着写了一遍,对最初认识机器学习还是有帮助的;
----------------------------------------------------------------------------
首先,导入数据集:

运行输出如下:

----------------------------------------------------------------------------
然后是各种画图,通过图像进行分析,
柱状图:

效果如下:

箱线图:

效果如下:

直方图:

效果如下:

关系图:

效果如下:

----------------------------------------------------------------------------
再然后是数据归一化:

接下来就是各种算法的拟合和评分了:
线性回归:(原文没有,自己加的看看的)

逻辑回归:

决策树:

KNN:

线性辨别分析:

高斯朴素贝叶斯:

支持向量机SVM:

算法们的评分输出:

根据上面的评分,发现KNN相对是最精确的,所以就用KNN做预测,用混淆矩阵查看报告

输出如下:

未完待续...
本文通过一个简单的水果分类问题,介绍了如何使用Python进行数据预处理、可视化及应用多种机器学习算法。其中包括逻辑回归、决策树、KNN等,并对比了各算法的准确性。
2384





