机器学习中的监督学习与无监督学习
1. 机器学习简介
在过去几十年里,社会上为各种目的收集的数据量大幅增加。机器学习是一种利用我们对数据的了解来理解这些数据的方法。在机器学习的通用框架中,计算机首先从给定的数据集进行学习(训练),并创建一个通用模型来表示它。借助这个模型,就可以预测各种结果、成果和分组(类别)。
机器学习主要分为三类:
- 监督学习 :给定一个简单的数据集,包含输入 x 和输出 y,当 x 和 y 都有已知标签时,算法将 x 映射到 y,训练后可以用 x 作为输入来预测 y 值。
- 无监督学习 :只有 x 有标签,算法自行找到 y 的标签。
- 强化学习 :计算机无需将输入映射到结果,而是对输入做出响应。例如下棋或其他游戏的算法就是这样工作的,它们尝试预测如何对输入做出反应,而没有明确可量化的结果,而是寻求强化,比如持续玩游戏直到不出错地结束(即获胜)。
Python 中一个功能丰富且流行的机器学习包是 Scikit - learn。它是 SciPy 工具包的一部分,2007 年首次发布,2011 年的一篇论文对其进行了介绍。该包维护良好,文档丰富。
以下是导入 Scikit - learn 并打印其版本号的代码:
import sklearn
sklearn.__version__
同时,我们还创建了一个 despine 函数,用于移除绘图或绘图网格中
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



