机器学习:监督vs无监督vs强化

当今世界产生的数据量非常巨大。这些数据不仅由人类生成,还由智能手机、计算机和其他设备生成。当然,基于可用的数据类型和存在的动机,程序员将选择如何使用特定的学习模型来训练算法。

机器学习是计算机科学的一部分,通过使用数据而不是程序员显式编程来重复执行任务,从而提高系统的效率。进一步让我们了解三种机器学习技术之间的区别——监督学习、非监督学习和强化学习。

监督学习

把自己想象成一个坐在教室里的学生,你的老师在监督你,“你如何解决问题”或“你做得是否正确”。同样,在监督学习中,输入以标记数据集的形式提供,模型可以从中学习,轻松提供问题的结果。

问题类型

监督学习处理两种类型的问题——分类问题和回归问题。

分类问题

该算法有助于预测离散值。可以认为,输入数据是特定类或组的成员。例如,在拍摄水果数据集的照片时,每张照片都被标记为芒果、苹果等。在这里,算法必须将新图像分类到这些类别中的任何一个。示例:

  • 贝叶斯分类器
  • 支持向量机
  • 逻辑回归
回归问题

这些问题用于连续数据。例如,根据面积、位置、房间数量等预测城市中一块土地的价格。然后将输入发送到机器,根据前面的例子计算土地价格。示例-

  • 线性回归
  • 非线性回归
  • 贝叶斯线性回归

无监督学习

这种学习算法与监督学习完全相反。简而言之,在无监督学习中没有完整和干净的标记数据集。无监督学习是自组织学习。其主要目的是探索潜在模式并预测输出。在这里,我们基本上为机器提供数据,并要求寻找隐藏的特征,并以一种有意义的方式对数据进行聚类。例子

  • K–表示聚类
  • 神经网络
  • 主成分分析

强化学习

它既不是基于监督学习,也不是基于无监督学习。此外,在这里,算法学会了自己对环境做出反应。它正在迅速发展,并且产生了各种学习算法。这些算法在机器人、游戏等领域非常有用。

对于学习代理,总是有一个开始状态和一个结束状态。然而,要达到最终状态,可能会有不同的路径。在强化学习问题中,智能体试图操纵环境。代理人从一个州旅行到另一个州。代理人在成功时获得奖励(赞赏),但在失败时不会获得任何奖励或赞赏。通过这种方式,代理从环境中学习。

监督学习与非监督学习与强化学习的主要区别

  1. 监督学习处理两个主要任务回归和分类。无监督学习处理聚类和关联规则挖掘问题。而强化学习处理的是开发或探索,马尔可夫决策过程、策略学习、深度学习和价值学习。
  2. 监督学习使用标记的数据,这里的输出数据模式是系统已知的。但是,无监督学习处理的是未标记的数据,其输出基于感知的集合。而在强化学习马尔可夫决策过程中,代理以离散的步骤与环境交互。
  3. 顾名思义,监督学习是高度监督的。无监督学习是不受监督的。与此相反,强化学习的监督程度较低,这取决于代理在确定输出时的作用。
  4. 监督学习中的输入数据为标记数据。然而,在无监督学习中,数据是未标记的。强化学习中没有预定义数据。
  5. 监督学习根据班级类型进行预测。无监督学习发现了潜在的模式。在强化学习中,学习代理充当一个奖励和行动系统。
  6. 监督学习图将数据标记为已知输出。然而,无监督学习探索模式并预测输出。强化学习遵循试错法。
  7. 总之,在监督学习中,目标是根据输入和输出值生成公式。在无监督学习中,我们发现输入值之间存在关联,并将其分组。在强化学习中,智能体通过与环境交互,通过延迟反馈进行学习。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值