机器学习系统的类型
机器学习系统的种类繁多,为了更好地理解和应用它们,我们可以根据以下几个标准对其进行大致分类:
1. 是否在人类监督下进行训练(监督学习、无监督学习、半监督学习和强化学习);
2. 是否能够从传入的数据流中进行增量学习(在线学习与批量学习);
3. 是通过简单地将新数据点与已知数据点进行比较来工作,还是像科学家一样检测训练数据中的模式并构建预测模型(基于实例的学习与基于模型的学习)。
这些标准并非相互排斥,可以任意组合。例如,最先进的垃圾邮件过滤器可能会使用基于垃圾邮件和正常邮件示例训练的深度神经网络模型进行实时学习,这使其成为一个在线、基于模型的监督学习系统。接下来,我们将更详细地探讨这些标准。
监督学习与无监督学习
机器学习系统可以根据训练过程中所接受的监督程度和类型进行分类,主要分为四大类:监督学习、无监督学习、半监督学习和强化学习。
监督学习
在监督学习中,提供给算法的训练数据包含了期望的解决方案,即标签。一个典型的监督学习任务是分类,如垃圾邮件过滤器,它通过大量的示例邮件及其分类(垃圾邮件或正常邮件)进行训练,从而学会如何对新邮件进行分类。
另一个典型任务是回归,即根据一组特征(如汽车的里程数、使用年限、品牌等)来预测目标数值,例如汽车的价格。为了训练系统,需要提供大量汽车的示例,包括特征和标签(价格)。
需要注意的是,一些回归算法也可用于分类,反之亦然。例如,逻辑回归常用于分类,因为它可以输出一个对应于属于给定类别的概率值。
以下是一些重要的监督学习算法:
- k近邻算法
- 线性回归
-
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



