一、机器学习介绍
1. 机器学习的由来
- 人工智能—— 目标
最初在1950年代出现了 “Artificial Intelligence” 这个词,人们希望机器可以跟人一样聪明。然而在很长一段时间人们并不知道怎么做。 - 机器学习—— 手段
到1980年代后,有了机器学习的方法。顾名思义,其意义为“让机器具有学习的能力”,即通过机器学习的手段,让它可以和人一样聪明。 - 深度学习
深度学习是机器学习的其中一个方法。
生物的行为取决于两件事:先天本能 + 后天学习的结果。在有机器学习之前,人们通过设定好机器的本能来达到预期目的。
生物的本能:
- 河狸筑水坝的能力是天生的:while(听到流水声) {筑水坝;}
提前手动设定好的天生本能:
- 聊天机器人:提前设定功能,当看到 “turn off” 就关掉音乐。但是缺点是很僵化,无法考虑到所有规则。
例如:“Please don’t turn off the music.”,本来表达“不要关掉”,机器却识别成“关掉”——在不同的语境中含有同样的词汇,表达了不同的意义,但做出了相同的指令!
2. 什么是机器学习?
考虑一个机器人,现在我们让它自己具有学习的能力。
语音
像教育小孩一样,我们给它一段内容为 “Hi” 的音频A,告诉它这个声音就是“Hi”。类似地,告诉它音频B(“How are you”)这段声音就是 “How are you”,音频C(“Good bye”)这段声音就是 “Good bye”。然后它就学会了,希望它得到给出的声音然后产生对应的结果。
图像
给一些动物的图片,再给出相应的动物名称,让机器人进行学习。经过大量重复的训练后,我们给出一个动物图片,机器人就会判断出是什么动物。
通过以上的比喻,抽象出来得到:机器学习就是在寻找一个function,即,要让机器具有一个能力: 根据你提供给它的数据,它来寻找出我们要寻找的映射关系——function。
- 在语音识别中,
f(语音) = 对应的文字
- 在图像识别中,
f(图像) = 图像中的事物
- 聊天机器人,
f(使用者的语音) = 机器的回应
3. 如何找出这个映射function?
-
Model【学生】:先准备一个function的集合,即模型,如图所示:
里面有成千上万个function,分别有不同的输入和输出。 -
Training Data【教科书】:用于训练的数据集,包含标注好的输入 + 输出
利用训练数据集,才能判断出model中的function的好坏。如同老师给学生的作业打分,正确加分,错误扣分。(这种给出标注的方法叫做 监督学习) -
从有效率的function中,找出最好的function,记作
f*
-
使用
f*
,输入一张未在训练集中的猫的图片,测试它的输出是否为“猫”
机器学习中一个非常重要的问题:机器是否有举一反三的能力!
综上所述,机器学习的步骤概括为如下:
即:模型,策略,算法。
二、机器学习的相关技术
- 监督学习:所用训练数据都是被标记过的
- 回归:可用于做天气PM2.5的预测
- 分类:垃圾邮件筛选(二分类问题)、文档归类
- 半监督学习:
- 减少训练数据集标记工作量
- 训练数据中部分标记的,部分无标记
- 无监督学习:
- 训练集中的所有数据都没有标记
- 根据类别未知的训练样本来解决问题
- 强化学习:
- 强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏
- 我们没有告诉机器正确的答案是什么,机器最终得到的只有⼀个分数,就是它做的好还是不好,但他不知道⾃⼰到底哪⾥做的不好,他也没有正确的答案。
- 迁移学习:
- 把已训练好的模型(预训练模型)参数迁移到新的模型来帮助新模型训练
- 结构化学习:
- 我们要机器输出的是,⼀个有结构性的东西
- 在分类的问题中,机器输出的只是⼀个选项;在structured类的problem⾥⾯,机器要输出的是⼀个复杂的物件