李宏毅机器学习(2017full)-Lecture 0-1: Introduction of Machine Learning

本文介绍了机器学习的基本概念,包括监督学习、无监督学习、半监督学习及强化学习等主要类型。探讨了机器学习中的关键步骤,如模型选择、回归与分类任务,并概述了几种典型的学习情景及其应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Introduction of Machine Learning

机器学习: 写程序让机器有学习的能力

1533172930151

机器学习的步骤:

  1. Model-定出function set

  2. 让mechine 可以衡量model中的function好不好,和自己的数据集和label是否相符

  3. 让机器可以自动挑出最好的方法 f f ∗

1533172979087

regression - 输出是数值。

classification - binary二分类+multi-class classification多分类

机器学习类别

  • supervised learning 监督学习。全有label,告诉我们input和output之间的关系

  • semi-supervised learning半监督学习。只有少量的标记好的label,另外还有大量猫和狗的图片,但是没有label

  • transfer learning。迁移学习。做猫狗分类,有少量label data,另外有其他不属于猫狗大量data,有的有label有的没

  • unsupervised learning。无监督学习。大量没有label的数据。 看了大量的例子之后,可不可以自己创造出来。

    (比如看了大量文章,是否可以学会其中词汇的意思。看了很多动物自后是否可以自己创造出来动物。只有function的output去训练,机器怎么学习去生成新的。)

  • reinforcement learning。 强化学习

    • supervised (learning from teacher)有带结果的数据。
    • reinforcement (learning from critics)没有告诉机器正确答案,只知道自己做的好不好。

ML Problem

  • regression

  • classification

    Regression和Classification的区别是机器输出的东西类别不同

    • regression输出是数值
    • classfication。输出是或否(二分类)、类别(多分类)
  • structured learning。【!】 输出有结构性的物件,而不同于。

    比如 语音识别(输出是有结构的句子),机器翻译(中句子->英文句子),人脸识别

    GAN -新的structured learning方法。

AlphaGo

  • supervised learning-开始用棋谱去训练学习
  • reinforce learning- 棋谱不多了,所以需要有一个对手,跟另一个机器进行学习。

1533173002874

scenario- 学习的情景,通常是自己没有办法控制(比如我们没有方法做训练,所以用reinforce)由你手中的数据决定
task-你要解决的问题。根据你找的function和output不同进行(每种scenario都需要去解决这些task)
methods- 同样的task,用不同的方法去解决。
绿色在每个红色方框都有,红色在每个蓝色方框里面都有。

reinforce learning 是没有办法做supervised learning 的时候才做的。

李宏毅机器学习(2017full)课程列表
Lecture 0-1: Introduction of Machine Learning视频

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值