人工智能中的机器学习:方法、进展与概率的力量
1. 机器学习的学习类型
1.1 无监督学习
无监督学习是指算法从无关联响应的原始示例中学习,自行确定数据模式。这种算法倾向于将数据重构为其他形式,例如可能代表某个类别的新特征或一系列不相关的值。其结果数据能为人类提供对原始数据含义的洞察,并为有监督机器学习算法提供新的有用输入。
无监督学习类似于人类判断某些对象或事件属于同一类别的方法,例如观察对象之间的相似程度。一些以营销自动化形式存在于网络上的推荐系统就基于这种学习类型。营销自动化算法根据用户过去的购买行为给出建议,这些推荐基于对用户最相似客户群体的估计,然后推断用户可能的偏好。
1.2 强化学习
强化学习与无监督学习类似,算法接收的示例也缺乏标签。但不同的是,可以根据算法提出的解决方案的后果,为示例提供正反馈或负反馈。
强化学习与算法必须做出决策的应用相关,并且这些决策会产生后果。在现实世界中,这就像通过试错来学习。错误会带来惩罚(如成本、时间损失、遗憾、痛苦等),从而让我们明白某些行动方案比其他方案更难成功。计算机自主学习玩电子游戏就是一个有趣的强化学习例子。
在这个例子中,应用程序向算法展示特定情况的示例,比如玩家在迷宫中躲避敌人。应用程序会让算法知道其采取行动的结果,算法在尝试避免危险和追求生存的过程中进行学习。可以在YouTube上观看“Google DeepMind’s Deep Q - learning playing Atari Breakout”视频,了解谷歌DeepMind创建的玩旧Atari电子游戏的强化学习程序。该程序最初笨拙且不熟练,但随着训练不断改进,最终成为冠军。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



