机器学习基石 - The VC Dimension

本文深入探讨了机器学习中VC维度的概念,特别是针对感知机的学习能力。内容涵盖了VC维度的定义及其与泛化误差的关系,并详细分析了感知机在不同维度下的VC维度,最后讨论了VC维度对于样本复杂度的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

机器学习基石上 (Machine Learning Foundations)—Mathematical Foundations
Hsuan-Tien Lin, 林轩田,副教授 (Associate Professor),资讯工程学系 (Computer Science and Information Engineering)

The VC Dimension

Recap

这里写图片描述

Definition of VC Dimension

VC Dimension

the formal name of maximum non-break point

这里写图片描述

the Four VC Dimensions

这里写图片描述

VC Dimension and Learning

  • finite dVCg d V C ⟹ g can generalize Eout(g)Ein(g) E o u t ( g ) ≈ E i n ( g )
  • regardless of learning algorithm A A 、input distribution P P 、target function f

VC Dimension of Perceptrons

2D PLA Revisited

这里写图片描述

d-D perceptrons: dVC=d+1 ? d V C = d + 1   ?

dVCd+1 d V C ≥ d + 1

这里写图片描述
- There are some d+1 d + 1 inputs we can shatter.
- 每一行代表一个点
- 灰色部分(第一列)视作第 0 维,是常数,代表 threshhold
- X X 可逆
- 任意的 Y Y 都可以表示出来

dVCd+1 d V C ≤ d + 1

这里写图片描述

  • We cannot shatter any set of d+2 d + 2 inputs.
  • linear dependence restricts dichotomy
  • 任意一个可以 shatter 的 d+1 d + 1 向量组再加一维
  • Xd+2 X d + 2 能被前 d+1 d + 1 个向量线性表出

Physical Intuition of VC Dimension

Degrees of Freedom 自由度

  • dVCfreeparameters d V C ≈ f r e e p a r a m e t e r s

Penalty for Model Complexity

这里写图片描述

  • with a high probability, EoutEin+Ω(N,H,δ) E o u t ≤ E i n + Ω ( N , H , δ )

  • The VC Message
    这里写图片描述

Sample Complexity

这里写图片描述

  • theory: N10000 dVC N ≈ 10000   d V C

  • practical: N10 dVC N ≈ 10   d V C often enough!

  • Looseness of VC Bound
    这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值