随机游走精确学习的研究进展
在机器学习领域,在线学习模型是一个重要的研究方向,它旨在让学习者通过与教师的交互,精确识别未知的目标函数。下面将详细介绍几种在线学习模型及其相关研究成果。
在线学习模型概述
在线学习模型(Online)的学习任务是精确识别教师从函数类 $C$ 中选择的未知目标函数 $f$。在每次试验中,教师向学习者发送一个点 $x \in X_n$,学习者需要预测 $f(x)$ 并将预测结果 $y$ 返回给教师。如果 $f(x) \neq y$,教师会返回“mistake”信息。学习者的目标是最小化预测错误的数量。
若学习者的算法 $A$ 对于任意 $f \in C$ 所犯的错误不超过 $t$ 个,则称算法 $A$ 以错误界限 $t$ 在线学习函数类 $C$。当经过 $t$ 次错误后,要求学习者的假设 $h$ 与目标函数 $f$ 完全等价,这种学习被称为精确学习。如果存在一个学习者能以多项式错误界限在线学习 $C$,且每次预测的运行时间为 $poly(n, size(f))$,则称 $C$ 是在线可学习的。学习者可能依赖于一个置信参数 $\delta$,错误界限 $t = poly(n, size(f), \log \frac{1}{\delta})$,并且经过 $t$ 次错误后 $h \neq f$ 的概率小于 $\delta$。
特定学习模型
除了基本的在线学习模型,还有几种具有不同约束条件的特定学习模型:
- 均匀随机在线模型(Uniform Random Online,UROnline) :在该模型中,连续的示例是从 $X_n$ 中独立且随机均匀选择的。
-
超级会员免费看
订阅专栏 解锁全文
155

被折叠的 条评论
为什么被折叠?



