李宏毅《机器学习》Task01 - 机器学习介绍

最新推荐文章于 2025-04-10 14:00:58 发布

Beta Lemon

最新推荐文章于 2025-04-10 14:00:58 发布

阅读量1k

点赞数 2

分类专栏：李宏毅《机器学习》笔记文章标签：机器学习人工智能

本文链接：https://blog.youkuaiyun.com/kkm09/article/details/119711409

版权

李宏毅《机器学习》笔记专栏收录该内容

9 篇文章

订阅专栏

一、机器学习介绍

1. 机器学习的由来

AI、ML、DL的关系

人工智能—— 目标
最初在1950年代出现了 “Artificial Intelligence” 这个词，人们希望机器可以跟人一样聪明。然而在很长一段时间人们并不知道怎么做。
机器学习—— 手段
到1980年代后，有了机器学习的方法。顾名思义，其意义为“让机器具有学习的能力”，即通过机器学习的手段，让它可以和人一样聪明。
深度学习
深度学习是机器学习的其中一个方法。

生物的行为取决于两件事：先天本能 + 后天学习的结果。在有机器学习之前，人们通过设定好机器的本能来达到预期目的。

生物的本能：

河狸筑水坝的能力是天生的：while(听到流水声) {筑水坝;}

提前手动设定好的天生本能：

聊天机器人：提前设定功能，当看到 “turn off” 就关掉音乐。但是缺点是很僵化，无法考虑到所有规则。
例如：“Please don’t turn off the music.”，本来表达“不要关掉”，机器却识别成“关掉”——在不同的语境中含有同样的词汇，表达了不同的意义，但做出了相同的指令！

2. 什么是机器学习？

考虑一个机器人，现在我们让它自己具有学习的能力。

语音

像教育小孩一样，我们给它一段内容为 “Hi” 的音频A，告诉它这个声音就是“Hi”。类似地，告诉它音频B（“How are you”）这段声音就是 “How are you”，音频C（“Good bye”）这段声音就是 “Good bye”。然后它就学会了，希望它得到给出的声音然后产生对应的结果。

图像

给一些动物的图片，再给出相应的动物名称，让机器人进行学习。经过大量重复的训练后，我们给出一个动物图片，机器人就会判断出是什么动物。

通过以上的比喻，抽象出来得到：机器学习就是在寻找一个function，即，要让机器具有一个能力： 根据你提供给它的数据，它来寻找出我们要寻找的映射关系——function。

在语音识别中，f(语音) = 对应的文字
在图像识别中，f(图像) = 图像中的事物
聊天机器人，f(使用者的语音) = 机器的回应

3. 如何找出这个映射function？

Model【学生】：先准备一个function的集合，即模型，如图所示：

里面有成千上万个function，分别有不同的输入和输出。
Training Data【教科书】：用于训练的数据集，包含标注好的输入 + 输出

利用训练数据集，才能判断出model中的function的好坏。如同老师给学生的作业打分，正确加分，错误扣分。（这种给出标注的方法叫做 监督学习）
从有效率的function中，找出最好的function，记作f*
使用 f*，输入一张未在训练集中的猫的图片，测试它的输出是否为“猫”

在这里插入图片描述

机器学习中一个非常重要的问题：机器是否有举一反三的能力！

综上所述，机器学习的步骤概括为如下：

即：模型，策略，算法。

二、机器学习的相关技术

Learning Map

机器学习分类

监督学习：所用训练数据都是被标记过的
- 回归：可用于做天气PM2.5的预测
- 分类：垃圾邮件筛选（二分类问题）、文档归类
半监督学习：
- 减少训练数据集标记工作量
- 训练数据中部分标记的，部分无标记
无监督学习：
- 训练集中的所有数据都没有标记
- 根据类别未知的训练样本来解决问题
强化学习：
- 强化学习是智能体（Agent）以“试错”的方式进行学习，通过与环境进行交互获得的奖赏指导行为，目标是使智能体获得最大的奖赏
- 我们没有告诉机器正确的答案是什么，机器最终得到的只有⼀个分数，就是它做的好还是不好，但他不知道⾃⼰到底哪⾥做的不好，他也没有正确的答案。
迁移学习：
- 把已训练好的模型（预训练模型）参数迁移到新的模型来帮助新模型训练
结构化学习：
- 我们要机器输出的是，⼀个有结构性的东西
- 在分类的问题中，机器输出的只是⼀个选项；在structured类的problem⾥⾯，机器要输出的是⼀个复杂的物件