机器学习与MLOps基础入门
1. 机器学习核心概念
1.1 机器学习定义
机器学习指计算机无需明确编程就能执行任务的能力,它通过从数据中“学习”来实现这一目标。例如,一个机器学习模型可以根据身高预测体重,它能从25000条观测数据中“学习”,进而做出预测。
1.2 机器学习类别
机器学习主要分为三类:监督学习、无监督学习和强化学习,具体内容如下表所示:
| 类别 | 说明 | 示例 |
| — | — | — |
| 监督学习 | “标签”已知,模型从历史数据中学习 | 根据身高和体重的历史数据预测体重 |
| 无监督学习 | 用于“发现”标签 | 对NBA球员进行聚类 |
| 强化学习 | “智能体”探索环境以学习如何执行任务 | AWS DeepRacer系统训练模型车在赛道上行驶 |
1.2.1 监督学习
在监督学习中,“标签”是已知的,模型会依据历史数据进行学习。例如前面提到的根据身高预测体重的例子,身高和体重就是标签,25000条观测数据则属于历史数据。需要注意的是,所有机器学习都要求数据为数值形式,并且需要进行缩放。比如朋友说跑了50,但不清楚是50英里还是50英尺,这就是在进行预测前需要对数据进行缩放的原因。
1.2.2 无监督学习
无监督学习的作用是“发现”标签。以2015 - 2016赛季的NBA为例,计算机能够“学习”如何对不同的NBA球员进行分组。计算机基于对球员的四个属性(得分、篮板、盖帽和助攻)进行比较,在多维空间中,将彼此距离总和最小的球员归为一组并形成标签。像勒布朗·詹姆斯和凯文·杜兰特会被归为一组,因为他们
超级会员免费看
订阅专栏 解锁全文

46

被折叠的 条评论
为什么被折叠?



