时间序列的在线学习:原理、算法与漂移处理
1. 在线学习与离线学习概述
学习主要有两种场景:在线学习和离线学习。在线学习是指随着数据的流入(流式数据)逐步拟合模型;而离线学习则是使用已知的静态数据集,一次性调整机器学习算法的参数以适应整个数据集(通常将整个数据集加载到内存中或分批加载)。
1.1 在线学习的主要用例
在线学习主要有以下三个主要用例:
- 大数据:在线学习适用于大数据场景,因为处理大规模数据集时,对整个数据集进行训练在计算上可能不可行。
- 时间限制:例如实时应用场景,许多在线算法相对于离线算法在资源利用上更高效。
- 动态环境:时间序列数据的潜在生成过程可能随时间变化,在线学习可以根据新数据不断调整参数,从而应对数据的变化。
1.2 在线学习与离线学习的差异对比
| 比较项 | 离线学习 | 在线学习 |
|---|---|---|
| 是否需要监控 | 是,模型可能会过时,性能下降 | 可适应变化的数据 |
| 重新训练成本 | 昂贵(从头开始) | 便宜(增量式) |
| 内存需求 | 可能需要高内存 | 低 |
| 应用场景 |
超级会员免费看
订阅专栏 解锁全文
1308

被折叠的 条评论
为什么被折叠?



