Coursera - 机器学习基石 - 课程笔记 - Week 5

本文探讨了在静态学习流程中，如何通过理论成长函数mH(N)来替代假设个数M，以解决M无限大时的学习问题。介绍了四种类型的成长函数，并讨论了突破点的概念，即在特定输入个数下，成长函数不再呈现指数级增长。

Training versus Testing

静态学习流程：
- 如果 $∣H∣=M|\mathcal H| = M$ 有限， $N$ 足够大
- 对任意一个被选择的 $g$ ， $Eout(g)≈Ein(g)E_{out}(g) \approx E_{in}(g)$
- 如果选择了一个 $g$ ， $Ein(g)≈0E_{in}(g) \approx 0$ ，PAC保证 $Eout(g)≈0E_{out}(g) \approx 0$ （学习可行）
由之前的课程可知，M的取值太大或者太小都很不好
无限大的M（PLA中），会产生什么样的影响？

针对既有点的可行的划分情况：二分图（dichotomy）
定义 $H(x1,x2,…,xN)=(h(x1),h(x2),…,h(xN))\mathcal{H}(\bold x_1,\bold x_2, \ldots, \bold x_N) = (h(\bold x_1), h(\bold x_2), \ldots, h(\bold x_N))$ 为定义在数据 $x1,x2,…,xN\bold x_1,\bold x_2, \ldots, \bold x_N$ 上的全部二分图
所有二分图的集合内容个数上界最多为 $2^N$
考虑到n个数据点的二分图结果依赖于数据本身，我们将理论成长函数取所有情况的最大值：
- $mH(N)=max⁡x1,x2,…,xN∈X∣H(x1,x2,…,xN)∣m_{\mathcal H}(N) = \max\limits_{\bold x_1,\bold x_2, \ldots, \bold x_N \in \mathcal X}|\mathcal H(\bold x_1,\bold x_2, \ldots, \bold x_N)|$
四类成长函数：
- 正向一维数据： $mH(N)=N+1m_{\mathcal H}(N) = N +1$
- 正向一维区间： $mH(N)=12N2+12N+1m_{\mathcal H}(N) = \frac12N^2+\frac12N+1$
- 凸二维集： $mH(N)=2Nm_{\mathcal H}(N) = 2^N$
- 二维感知器： $mH(N)<2Nm_{\mathcal H}(N) < 2^N$

如果使用 $mH(N)m_{\mathcal H}(N)$ 代替M估计上界：
- 优点：避免无限大M对结果的影响
- 缺点：指数增长
突破点：以二维感知器空间为例，不再得到指数个二分图的输入个数
- $mH(k)<2km_{\mathcal H}(k) < 2^k$
- 往后的k都是突破点
- 目前只考虑最小的k（也就是4）