课程推荐丨深度强化学习第一课——小白入门攻略篇

本文介绍了深度强化学习的概念及其与传统机器学习的区别,并列举了多种应用案例,如控制直升机飞行、维持机器人平衡及游戏竞技等。此外,还推荐了一门适合有一定Python基础学员的课程。

有人说“深度强化学习 (DRL,Deep Reinforcement learning) 是实现人工智能 (AI,Artificial Intelligence) 最可行的解决方案。未来十年它将影响我们每一个人的生活、工作和学习。”在这种观点下,深度强化学习就是人工智能,人工智能就是深度强化学习,二者是等价的。

那么,什么是深度强化学习呢?

一般来说,机器学习分为监督学习(Supervised learning),非监督学习(Unsupervised learning)以及强化学习(Reinforcement learning)三类。与监督学习,非监督学习不同,强化学习是一种多阶段的接收环境反馈的机器学习方法。强化学习的学习目标是从环境状态到行为映射关系,从而使得系统的一系列行为从环境中获得的累计奖赏最大(损失最小)

强化学习的应用范围非常广泛,人们可以利用强化学习来控制直升机的飞行姿态,使得直升机可以按照既定的路线飞行;也可以利用强化学习来控制机器人,使机器人保持站立状态,不会摔倒;还可以利用强化学习学习打游戏,下围棋,学习之后的算法能够完爆人类能力,前一阵子,最火爆的 AlphaGo 其实就是这个领域最好的见证。

基于此,我们邀请了香港理工大学计算机系博士—Traffas 为大家进行分享,这门课针对有一定基础的学员,如果您有一定的 Python 基础(点击阅读原文,我们也会有 Python 的内容推荐),将会更好的理解这门课的内容。

扫描海报添加小助手,获取报名方式。

课程推荐丨深度强化学习第一课——小白入门攻略篇
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值