离线学习
常见的学习方式,一次性将所有数据参与进训练。
- 离线学习完成了目标函数的优化将不会在改变了
- 离线学习需要一次提供整个训练集
- 时间和空间成本效率低
- 发生数据变更或模型漂移需要从头开始训练
- 离线学习模型稳定性高,方便做模型的验证评估
在线学习
在线学习,能够根据线上反馈数据,实时快速地进行模型调整,使得模型及时反映线上的变化,提高线上预测的准确率。将模型的预测结果展现给用户,然后收集用户的反馈数据,再用来训练模型,形成闭环。
- 在线学习一种模型的训练方法,在这种方法中,数据按顺序可用,并用于在每一步更新未来数据的最佳预测值。
- 在线学习的数据效率高,适应性强。在线学习是数据高效的,因为一旦数据被消耗,就不再需要它了。
- 从技术上讲,这意味着您不必存储数据。在线学习是可以适应的,因为它没有假设你的数据的分布。当您的数据分布发生改变或漂移时,由于客户行为的变化,模型可以动态调整以实时跟上趋势。
- Flink的流批一体,为了做一些类似的离线学习,你必须创建一个滑动窗口的数据和重训一次。
增量学习
增量学习是机器学习的一种方法,在其中,输入数据不断被用于扩展现有模型的知识,即进一步训练模型,它代表了一种动态的学习的技术。
- 可以学习新的信息中的有用信息
- 不需要访问已经用于训练分类器的原始数据
- 对已经学习的知识具有记忆功能
- 在面对新数据中包含的新类别时,可以有效地进行处理