犯罪数据在线监督学习框架与大数据安全索引存储
1. 犯罪数据在线监督学习框架
在犯罪数据分析领域,为了对比不同算法在离线和在线模式下的性能,采用了Python进行离线实现,使用Vowpal Wabbit进行在线实现。具体处理了以下几个问题:
- 二元分类问题 :预测是否会发生逮捕,采用Logistic回归,使用了HingeLoss和Logistic Loss两种不同的损失函数。
- 多类别分类问题 :预测会发生哪种类型的犯罪,同样使用类似的损失函数进行分类和性能测试。
- 线性回归问题 :将逮捕数量以时间序列数据呈现,使用Squared、Quantile和Poisson损失函数分析性能。
| 问题编号 | 算法 | 离线模式时间 | 在线独立模式时间 | 在线集群模式时间 |
|---|---|---|---|---|
| 1 | 二元分类 - 逻辑回归 | 63.45 | 8.72 | 4.32 |
| 2 | 多类别分类 - 一对多回归 | 85.4 | 11.23 | 5.31 |
超级会员免费看
订阅专栏 解锁全文

1万+

被折叠的 条评论
为什么被折叠?



