- 博客(3)
- 收藏
- 关注

原创 《Reinforcement Learning: An Introduction》强化学习导论英文教材自译中文版Chapter 2
《Reinforcement Learning: An Introduction》强化学习导论英文教材自译中文版Chapter 2Chapter 2 “多臂”赌博机强化学习区别于其他学习方法最重要的特征在于:它使用训练信息来评估(evaluate)采取的行动而非直接给出正确行动的指令(instruct)。因此需要进行广泛的探索,即:明确地搜索好的行为。单独的评估反馈会表明某个行为有多好,而非它...
2020-01-12 23:16:23
1790
1
原创 JupyterLab如何在一个.ipynb文件中导入其他的.ipynb文件
JupyterLab总所周知是一款非常好用的Pyhton IDE,其是包含了Jupyter(notebook)的超集。所以,在Jupyter notebook中能做的事情,在JupyterLab中都可以做。而且能做的事情更多。但是由于JupyterLab生成的文件与Jupyter notebook类似,都是以.ipynb结尾,当用户希望以from * import * 的方式在一个.ipynb...
2019-10-09 20:47:58
6236
2
原创 《Reinforcement Learning: An Introduction》强化学习导论英文教材自译中文版Chapter 1
Chapter 1 介绍当我们思考学习的本质时,第一个来到我们脑海中的想法便是通过与环境互动来学习。当婴儿玩耍时、舞动双臂时或四处张望时,尽管没有一个明确存在的“导师”,但确是与环境产生了直接的观感联结。通过这种联结不断实践会产生大量的因果信息、行动结果信息以及能够用来指导我们如何行动以达成特定目标的信息。在生活中,这种互动无疑是我们了解自身与自身所处环境的主要来源。无论是学习如何驾驶一辆汽车还...
2019-02-19 01:03:38
7776
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人