19、人工智能中的机器学习:方法、进展与概率的力量

人工智能中的机器学习:方法、进展与概率的力量

1. 机器学习的学习类型

1.1 无监督学习

无监督学习是指算法从无关联响应的原始示例中学习,自行确定数据模式。这种算法倾向于将数据重构为其他形式,例如可能代表某个类别的新特征或一系列不相关的值。其结果数据能为人类提供对原始数据含义的洞察,并为有监督机器学习算法提供新的有用输入。

无监督学习类似于人类判断某些对象或事件属于同一类别的方法,例如观察对象之间的相似程度。一些以营销自动化形式存在于网络上的推荐系统就基于这种学习类型。营销自动化算法根据用户过去的购买行为给出建议,这些推荐基于对用户最相似客户群体的估计,然后推断用户可能的偏好。

1.2 强化学习

强化学习与无监督学习类似,算法接收的示例也缺乏标签。但不同的是,可以根据算法提出的解决方案的后果,为示例提供正反馈或负反馈。

强化学习与算法必须做出决策的应用相关,并且这些决策会产生后果。在现实世界中,这就像通过试错来学习。错误会带来惩罚(如成本、时间损失、遗憾、痛苦等),从而让我们明白某些行动方案比其他方案更难成功。计算机自主学习玩电子游戏就是一个有趣的强化学习例子。

在这个例子中,应用程序向算法展示特定情况的示例,比如玩家在迷宫中躲避敌人。应用程序会让算法知道其采取行动的结果,算法在尝试避免危险和追求生存的过程中进行学习。可以在YouTube上观看“Google DeepMind’s Deep Q - learning playing Atari Breakout”视频,了解谷歌DeepMind创建的玩旧Atari电子游戏的强化学习程序。该程序最初笨拙且不熟练,但随着训练不断改进,最终成为冠军。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值