林轩田机器学习基石课程学习笔记2. Learning to Answer Yes/No

最新推荐文章于 2021-02-16 10:57:43 发布

原创最新推荐文章于 2021-02-16 10:57:43 发布 · 259 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

林轩田机器学习基石专栏收录该内容

2 篇文章

订阅专栏

本文探讨了机器学习中如何解决是否题，介绍了感知器及其假设集，通过Perceptron Learning Algorithm(PLA)选择最优解，讨论了线性可分数据及非线性可分数据下的解决方案。

Learning to Answer Yes/No

回顾: 有一个A,看D和H set,从H set里面选一个g,当成学到的技能(要不要给顾客发信用卡这样一个公式),今天讲机器怎么解决要不要发信用卡的问题,或者说,怎么去解决是非题.

Perceptron Hypothesis Set

在这里插入图片描述
-介绍一个具体的H的长像. perceptron(感知器),把问题数学化,就可以用一个公式来表示了.

可以看一看 h具体长什么样子,h对应到平面上的一条线.
上面的是在二维空间里的

Perceptron Learning Algorithm (PLA)

在这里插入图片描述

知道了h的长像,如何从这么多h里面选择一条最好的出来?
不知道f,希望在看过的资料里面一样.
拿一条线在手上,犯错误后,修正一下.
初始的w可以全是0
1. 如果线不完美,可以找到一条线犯了错误(这时候看作是在3维空间上)
2. 修正的公式如上
3. 更新到不再犯错为止
会不会停下来.g和f一不一样?

Guarantee of PLA

在这里插入图片描述

如果线性可分,PLA会停下来吗
到这里只证明了,可以越来越接近(product变大了)
-
这里没有具体证明,李航的书上有明确的证明.

Non-Separable Data

在这里插入图片描述

PLA好处是很快
坏处是,需要假设资料线性可分的,就算是线性可分的,也不知道什么时候会停.
机器学习的设定并不是说,资料一定很完整的从f中产生出来的.产生资料,收集资料的过程中可能有一些杂讯.
-
首先,杂讯应该是很少的,如果杂讯很多的话,就没有学习的必要了.
找一条犯错误最少的线.
这个问题被证明是NP hard
找一条差不多的线.
用随机找错误的方法.

介绍了线性解是非题的办法. PLA只在线性可分的时候有用.不是线性可分pocket也可以做的很好.
下一次课机器学习不只可以做是否题,可以做其它的问题,和其它资料的形式.

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。