犯罪数据的在线监督学习框架
1. 在线学习概述
在线学习是机器学习中的一个重要领域,其中感知机(Perceptron)是最古老的在线学习算法。感知机接收输入,将其与现有权重相乘,通过输出标量的符号来确定输入所属的类别。随后,接收真实类别标签并与预测值进行比较,计算损失并相应地调整权重。它本质上是一种在线模型,每次只向模型呈现一个训练数据点。
在 60 年代后期,出现了其他一阶算法,如 Winnow 算法和被动 - 激进在线学习算法。而当最著名的凸优化算法——梯度下降的在线版本被正式提出时,在线学习取得了重大突破。
在线梯度下降算法是用于各种任务(主要是分类)的最常用的凸优化算法之一。在文献中,提出了不同的在线梯度下降(OGD)变体,以改进理论界限或解决实际问题,如自适应在线梯度下降(adaptive OGD)和小批量 OGD 等。此外,还开发了二阶算法,如二阶感知机、置信加权学习、自适应正则化等。最近,草图在线牛顿算法(Sketched Online Newton algorithm)显著提高了二阶学习的速度。
对于预测任务,还开发了与线性回归概念平行的在线回归算法。该算法通过特定函数在新输入实例之前调整权重,该函数仅以第 n 个数据点作为输入,并返回修改后的权重向量集,进而可以预测测试数据的值。
2. Vowpal Wabbit 介绍
Vowpal Wabbit 是一个机器学习系统,它通过在线、哈希、全规约、约简、学习到搜索、主动和交互式学习等技术推动了机器学习的前沿发展。它特别专注于强化学习,实现了多种上下文老虎机算法,其在线特性非常适合解决相关问题。Vowpal Wabbit 是实现和完善最先进算法的理想选择,
超级会员免费看
订阅专栏 解锁全文
888

被折叠的 条评论
为什么被折叠?



