【机器学习基石笔记】六、举一反三的理论

本文探讨了成长函数mH(N)的概念,即对于N个点,在H集上可能的二分方法数量。同时介绍了breakPoint的概念及其在不同场景下的应用,并通过数学归纳法推导了多项式边界。最后总结了Generalization理论,指出当存在breakPoint且N足够大时,Ein和Eout可以任意接近。

成长函数 mH(N):

当有N个点的时候,在H集上有多少种二分的方法。

 

breakPoint:

对任意的n个点,都没有2^n种不同的分割。n就是breakPoint。

 

定义B(N, k)

在k是breakPoint的情况下,N个点最多有多少种不同的分割。

可以画出B(N, k)图像:

B(N, 1) = 1

k比较大时,B(N, k) = 2^N

N比较大时,证明B(N, k) = 2 * a + b。分类为

其中a是成对的, b是单独的。

a + b <= B(N-1, k)

a <= B(N-1, k-1)

两式相加,得到 B(N, k) <= B(N-1, k) + B(N-1, k-1)

事实可以证明为等号。

 

用数学归纳法,可以得到多项式边界。

 

三个步骤证明下式:

P(存在h, 使得|Ein - Eout| > epsilon) -> 0

1、将Eout用Ein'代替,多出来2倍,Ein'有1/2的概率在Ein的另一侧。

2、对H分类

3、使用Hoeffding,证明Ein和Ein'离得很近。

 

总结Generalization的理论:

1、有breakPoint

2、N足够大

那么就可以使Ein和Eout任意接近。

转载于:https://www.cnblogs.com/yesuuu/p/7502650.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值