
强化学习
昵称熠被占有
西南交通大学交通运输规划与管理专业在读博士
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
《Reinforcement Learning: An Introduction》强化学习导论英文教材自译中文版Chapter 2
《Reinforcement Learning: An Introduction》强化学习导论英文教材自译中文版Chapter 2Chapter 2 “多臂”赌博机强化学习区别于其他学习方法最重要的特征在于:它使用训练信息来评估(evaluate)采取的行动而非直接给出正确行动的指令(instruct)。因此需要进行广泛的探索,即:明确地搜索好的行为。单独的评估反馈会表明某个行为有多好,而非它...原创 2020-01-12 23:16:23 · 1875 阅读 · 1 评论 -
《Reinforcement Learning: An Introduction》强化学习导论英文教材自译中文版Chapter 1
Chapter 1 介绍当我们思考学习的本质时,第一个来到我们脑海中的想法便是通过与环境互动来学习。当婴儿玩耍时、舞动双臂时或四处张望时,尽管没有一个明确存在的“导师”,但确是与环境产生了直接的观感联结。通过这种联结不断实践会产生大量的因果信息、行动结果信息以及能够用来指导我们如何行动以达成特定目标的信息。在生活中,这种互动无疑是我们了解自身与自身所处环境的主要来源。无论是学习如何驾驶一辆汽车还...原创 2019-02-19 01:03:38 · 7979 阅读 · 3 评论