李宏毅《机器学习》Task01 - 机器学习介绍

一、机器学习介绍

1. 机器学习的由来

AI、ML、DL的关系

  • 人工智能—— 目标
    最初在1950年代出现了 “Artificial Intelligence” 这个词,人们希望机器可以跟人一样聪明。然而在很长一段时间人们并不知道怎么做。
  • 机器学习—— 手段
    到1980年代后,有了机器学习的方法。顾名思义,其意义为“让机器具有学习的能力”,即通过机器学习的手段,让它可以和人一样聪明。
  • 深度学习
    深度学习是机器学习的其中一个方法。

生物的行为取决于两件事:先天本能 + 后天学习的结果。在有机器学习之前,人们通过设定好机器的本能来达到预期目的。

生物的本能:

  • 河狸筑水坝的能力是天生的:while(听到流水声) {筑水坝;}

提前手动设定好的天生本能:

  • 聊天机器人:提前设定功能,当看到 “turn off” 就关掉音乐。但是缺点是很僵化,无法考虑到所有规则。
    例如:“Please don’t turn off the music.”,本来表达“不要关掉”,机器却识别成“关掉”——在不同的语境中含有同样的词汇,表达了不同的意义,但做出了相同的指令!

2. 什么是机器学习?

考虑一个机器人,现在我们让它自己具有学习的能力。

语音

像教育小孩一样,我们给它一段内容为 “Hi” 的音频A,告诉它这个声音就是“Hi”。类似地,告诉它音频B(“How are you”)这段声音就是 “How are you”,音频C(“Good bye”)这段声音就是 “Good bye”。然后它就学会了,希望它得到给出的声音然后产生对应的结果。

图像

给一些动物的图片,再给出相应的动物名称,让机器人进行学习。经过大量重复的训练后,我们给出一个动物图片,机器人就会判断出是什么动物。

通过以上的比喻,抽象出来得到:机器学习就是在寻找一个function,即,要让机器具有一个能力: 根据你提供给它的数据,它来寻找出我们要寻找的映射关系——function

  • 在语音识别中,f(语音) = 对应的文字
  • 在图像识别中,f(图像) = 图像中的事物
  • 聊天机器人,f(使用者的语音) = 机器的回应

3. 如何找出这个映射function?

  1. Model【学生】:先准备一个function的集合,即模型,如图所示:
    function
    里面有成千上万个function,分别有不同的输入和输出。

  2. Training Data【教科书】:用于训练的数据集,包含标注好的输入 + 输出
    Training Data
    利用训练数据集,才能判断出model中的function的好坏。如同老师给学生的作业打分,正确加分,错误扣分。(这种给出标注的方法叫做 监督学习

  3. 从有效率的function中,找出最好的function,记作f*

  4. 使用 f*,输入一张未在训练集中的猫的图片,测试它的输出是否为“猫”

在这里插入图片描述

机器学习中一个非常重要的问题:机器是否有举一反三的能力!

综上所述,机器学习的步骤概括为如下:
流程
即:模型,策略,算法

二、机器学习的相关技术

Learning Map

机器学习分类

  • 监督学习:所用训练数据都是被标记过的
    • 回归:可用于做天气PM2.5的预测
    • 分类:垃圾邮件筛选(二分类问题)、文档归类
  • 半监督学习:
    • 减少训练数据集标记工作量
    • 训练数据中部分标记的,部分无标记
  • 无监督学习:
    • 训练集中的所有数据都没有标记
    • 根据类别未知的训练样本来解决问题
  • 强化学习:
    • 强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏
    • 我们没有告诉机器正确的答案是什么,机器最终得到的只有⼀个分数,就是它做的好还是不好,但他不知道⾃⼰到底哪⾥做的不好,他也没有正确的答案。
  • 迁移学习:
    • 把已训练好的模型(预训练模型)参数迁移到新的模型来帮助新模型训练
  • 结构化学习:
    • 我们要机器输出的是,⼀个有结构性的东西
    • 在分类的问题中,机器输出的只是⼀个选项;在structured类的problem⾥⾯,机器要输出的是⼀个复杂的物件
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Beta Lemon

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值