机器学习的分类、应用与挑战
1. 机器学习系统的学习方式分类
机器学习系统可以根据不同的标准进行分类,其中两种重要的分类方式为批量学习和在线学习。
1.1 批量学习
批量学习中,系统无法进行增量学习,必须使用所有可用数据进行训练。这通常需要大量时间和计算资源,因此一般离线进行。具体流程如下:
1. 首先对系统进行训练。
2. 然后将其投入生产,之后不再进行学习,仅应用所学知识,这也被称为离线学习。
若要让批量学习系统了解新数据(如新型垃圾邮件),需要重新使用完整数据集(包括新旧数据)训练新版本的系统,然后停用旧系统并替换为新系统。虽然整个训练、评估和部署机器学习系统的过程可以轻松自动化,但使用全量数据训练可能需要数小时,所以通常每 24 小时甚至每周才训练一次新系统。如果系统需要适应快速变化的数据(如预测股票价格),则需要更具响应性的解决方案。此外,使用全量数据训练需要大量计算资源,若数据量巨大,使用批量学习算法甚至可能不可行。对于资源有限且需自主学习的系统(如智能手机应用或火星探测器),携带大量训练数据并占用大量资源进行长时间训练是不可行的。在这些情况下,使用能够增量学习的算法是更好的选择。
1.2 在线学习
在线学习通过按顺序向系统提供数据实例(单个或小批量)来进行增量训练。每个学习步骤快速且成本低,因此系统可以在新数据到来时即时学习。以下是在线学习的一些特点:
- 适用于接收连续数据流(如股票价格)且需要快速或自主适应变化的系统。
- 对于计算资源有限的情况也是不错的选择,因为系统学习新数据实例后,不再需要这些数据(除非需要回滚到先前状态并“重播”数据),这可以节省大
机器学习分类与挑战解析
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



