林轩田机器学习基石课程学习笔记2. Learning to Answer Yes/No

本文探讨了机器学习中如何解决是否题,介绍了感知器及其假设集,通过Perceptron Learning Algorithm(PLA)选择最优解,讨论了线性可分数据及非线性可分数据下的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Learning to Answer Yes/No


回顾: 有一个A,看D和H set,从H set里面选一个g,当成学到的技能(要不要给顾客发信用卡这样一个公式),今天讲机器怎么解决要不要发信用卡的问题,或者说,怎么去解决是非题.


Perceptron Hypothesis Set

在这里插入图片描述
-介绍一个具体的H的长像. perceptron(感知器),把问题数学化,就可以用一个公式来表示了.
在这里插入图片描述

  • 可以看一看 h具体长什么样子,h对应到平面上的一条线.
  • 上面的是在二维空间里的
Perceptron Learning Algorithm (PLA)

在这里插入图片描述

  • 知道了h的长像,如何从这么多h里面选择一条最好的出来?
  • 不知道f,希望在看过的资料里面一样.
  • 拿一条线在手上,犯错误后,修正一下.
    在这里插入图片描述
  • 初始的w可以全是0
    1. 如果线不完美,可以找到一条线犯了错误(这时候看作是在3维空间上)
    2. 修正的公式如上
    3. 更新到不再犯错为止
      在这里插入图片描述
  • 会不会停下来.g和f一不一样?
Guarantee of PLA

在这里插入图片描述

  • 如果线性可分,PLA会停下来吗
    在这里插入图片描述
  • 到这里只证明了,可以越来越接近(product变大了)
    -在这里插入图片描述
  • 这里没有具体证明,李航的书上有明确的证明.
Non-Separable Data

在这里插入图片描述

  • PLA好处是很快
  • 坏处是,需要假设资料线性可分的,就算是线性可分的,也不知道什么时候会停.
    在这里插入图片描述
  • 机器学习的设定并不是说,资料一定很完整的从f中产生出来的.产生资料,收集资料的过程中可能有一些杂讯.
    -在这里插入图片描述
  • 首先,杂讯应该是很少的,如果杂讯很多的话,就没有学习的必要了.
  • 找一条犯错误最少的线.
  • 这个问题被证明是NP hard
    在这里插入图片描述
  • 找一条差不多的线.
  • 用随机找错误的方法.

介绍了线性解是非题的办法. PLA只在线性可分的时候有用.不是线性可分pocket也可以做的很好.
下一次课机器学习不只可以做是否题,可以做其它的问题,和其它资料的形式.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值