- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 Sublime3使用记录 (Windows)
下载:http://www.sublimetext.com/3sublime是一款跨平台代码编辑器,有大量插件供大家下载Package Control可以直接从网上下载再解压到C:*****\Sublime Text 3\Packages中。 也可以下载一个package control来管理和下载插件。 进入Package Control官网可查看具体教程,下载教程地址为https://p
2015-06-29 23:11:42
1613
原创 Reinforcement Learning——Different Policies
Evaluative Feedback 不同于instructive feedback,Evaluative Feedback完全取决于当前action,而instructive feedback完全独立于action,与action 无关。 为了简化问题,我们只考虑在一个状态下的情况,不考虑连续多个状态下action的选择。Qt(a)=r1+r2+……+rkakaQ_t(a)=\frac{r_1
2015-06-07 11:57:35
524
原创 Python包RLPY初识(一)
第一次发博客有点小紧张 _(:зゝ∠)_ (本文将简单介绍一下Python包RLPY) 下面先给出链接:该网站可查看RLPY架包的文档说明 安装RLPY可选择直接使用pip安装工具:pip install -U rlpy MACOS:xcode-select –install 另外还可以下载源码后执行python setup.py install安装。 过程中可能需要另外一些Python
2015-06-03 00:17:33
1685
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人