博弈论、在线学习与提升算法:从理论到实践
1. α - Boost算法与最小间隔最大化
在解决分类问题时,我们常常希望找到一个具有最大最小间隔的组合分类器。α - Boost算法就是这样一种可以用于最大化最小间隔的方法。通过一系列推导,我们可以得到所有示例 $x$ 的间隔至少为:
[2\gamma - \alpha(1 + 2\gamma) - \frac{\ln m}{\alpha T}]
当迭代次数 $T$ 非常大时,最右边的项 $\frac{\ln m}{\alpha T}$ 可以忽略不计。此时,间隔会趋近于 $2\gamma$,这是在给定 $\gamma$ - 弱学习假设下的最佳可能间隔。因此,我们可以通过选择一个足够小的 $\alpha$,并进行长时间的算法运行,找到一个最小间隔任意接近最优值的组合分类器。
不过,α - Boost算法也存在一些缺点。由于 $\alpha$ 必须很小,相应地 $T$ 必须很大,所以该算法在实际应用中速度较慢。
2. 便士匹配游戏介绍
便士匹配游戏,也称为奇偶游戏,是一种简单但富有策略性的游戏。游戏中有两名玩家,分别为“偶数”玩家和“奇数”玩家。在每一轮游戏中,两名玩家同时选择并揭示一个单比特,用 $+$ 或 $-$ 表示(有时也用 $+1$ 和 $-1$ 表示)。如果两个比特相同,“偶数”玩家获胜;否则,“奇数”玩家获胜。游戏通常会进行多轮。
这个游戏与石头 - 剪刀 - 布类似,包含了读心竞赛的元素。每个玩家都试图预测对方的行动,并相应地做出反应,同时还要让自己的行为难以预测。虽然玩家理论上可以完全随机地选择比特(这是该游戏的极小极大策略),但人类在没有外部随机源(如硬币或计算机)的
超级会员免费看
订阅专栏 解锁全文

1092

被折叠的 条评论
为什么被折叠?



