本文内容为学习麻瓜编程python–实用主义教学,整理的学习笔记,作为复习的资料,后边忘了的时候回来看看。
麻瓜编程官网 https://www.mugglecode.com/
数据集(详细描述见下方)提取地址:https://video.mugglecode.com/fruit_data.csv
第一篇 机器学习–手工实现水果分类器
文章概览
什么是机器学习?
水果分类器是怎么实现的?
什么是机器学习?
- “学习”问题通常包括n个数据样本(训练样本)
- 每个样本函数有特定的属性(特征)
- 通过特定的算法从训练样本中学习到知识(信息),从而建立一个模型。
- 然后预测位置数据(测试样本)的信息
水果分类器是怎么实现的?
01 问题拆解
- 如何分割数据集,用于训练和验证模型?
- 如何计算样本的距离?
- 如何找到最近的样本?
- 如何验证模型?
02 解决思路
- 利用scikit-learn模块中的train_test_split()方法进行数据集的划分,其中test_size用于指定测试集的大小,这里test_size=1/5;random_state:用于指定随机状态,通常设定一个固定的数字用于重复实验,这里random_state=20;