4、犯罪数据的在线监督学习框架

犯罪数据的在线监督学习框架

1. 在线学习概述

在线学习是机器学习中的一个重要领域,其中感知机(Perceptron)是最古老的在线学习算法。感知机接收输入,将其与现有权重相乘,通过输出标量的符号来确定输入所属的类别。随后,接收真实类别标签并与预测值进行比较,计算损失并相应地调整权重。它本质上是一种在线模型,每次只向模型呈现一个训练数据点。

在 60 年代后期,出现了其他一阶算法,如 Winnow 算法和被动 - 激进在线学习算法。而当最著名的凸优化算法——梯度下降的在线版本被正式提出时,在线学习取得了重大突破。

在线梯度下降算法是用于各种任务(主要是分类)的最常用的凸优化算法之一。在文献中,提出了不同的在线梯度下降(OGD)变体,以改进理论界限或解决实际问题,如自适应在线梯度下降(adaptive OGD)和小批量 OGD 等。此外,还开发了二阶算法,如二阶感知机、置信加权学习、自适应正则化等。最近,草图在线牛顿算法(Sketched Online Newton algorithm)显著提高了二阶学习的速度。

对于预测任务,还开发了与线性回归概念平行的在线回归算法。该算法通过特定函数在新输入实例之前调整权重,该函数仅以第 n 个数据点作为输入,并返回修改后的权重向量集,进而可以预测测试数据的值。

2. Vowpal Wabbit 介绍

Vowpal Wabbit 是一个机器学习系统,它通过在线、哈希、全规约、约简、学习到搜索、主动和交互式学习等技术推动了机器学习的前沿发展。它特别专注于强化学习,实现了多种上下文老虎机算法,其在线特性非常适合解决相关问题。Vowpal Wabbit 是实现和完善最先进算法的理想选择,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值