台湾大学林轩田《机器学习基石》学习笔记第4讲——Feasibility of Learning

最新推荐文章于 2021-07-13 21:17:38 发布

原创

最新推荐文章于 2021-07-13 21:17:38 发布 · 550 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#Machine Learning #机器学习基石 #林轩田 #学习笔记

本文深入探讨机器学习的可行性，通过No Free Lunch定理揭示学习的挑战，并借助PAC（Probably Approximately Correct）理论，阐述当样本数量足够大时，如何确保模型在未知数据上的预测性能。霍夫丁不等式在其中起到关键作用，保证了在有限假设集合下，机器学习是可行的。

上节课，我们主要介绍了机器学习可以根据元素的不同情况分为不同的类型。其中，监督式学习、非监督式学习、半监督式学习和增强学习。本节课，我们将介绍机器学习的可行性，讨论问题是否可以使用机器学习来解决。

一、Learning is Impossible？
机器学习一定是可行的吗？
这里写图片描述

第一个例子，我们可以找到不同的g(x)，它同时满足所有训练样本D；
但当有一个新的x输入时，应用不同的g(x)，会得到完全相反的y；
那么我们认为这个机器学习并没有学习到!？

这里写图片描述

第二个例子，我们找到这样一个g≈f，可以满足所有的训练样本D
但是在D以外的未知数据上，g≈f不一定成立。
而机器学习目的，恰恰是希望我们选择的模型能在未知数据上的预测与真实结果是一致的，而不是在已知的数据集D上寻求最佳效果。

所以我們想要的是资料以外的部分。但是这两个例子好像告我们想要的事情是做不到的。我们把这一系列的研究叫做No Free Lunch（没有免费的午餐）。NFL理论告诉我们：

不存在一个与具体应用无关的，普遍适用的“最优分类器”
学习算法必须要作出一个与问题领域有关的“假设”，分类器必须与问题域相适应。

In the field of optimization, the NFL means that without a prior assumption about th

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。