- 博客(6)
- 收藏
- 关注
翻译 DQN
DQN 算法分析: 我们的环境是确定性的,所以为了简单起见,这里给出的所有方程也是确定性地制定的。 在强化学习文献中,他们也将对环境随机转换产生预估。我们的目标是训练一个策略来最大化回报Rt0=∑∞t=t0γt−t0rtR_{t_0} = \sum_{t=t_0}^{\infty} \gamma^{t - t_0} r_t, γ\gamma是折扣,是00到11之间的一个常数,用来保证和是收敛的。它
2019-04-14 23:05:47
6059
原创 C++ 数组直接存入已有的动态Eigen 矩阵 (Mapping array back to an existing Eigen matrix)
C++ 数组直接存入已有的动态Eigen 矩阵Mapping array back to an existing Eigen matrix准备工作:#include <Eigen/Dense>using namespace Eigen;构建一个动态矩阵,并创建一个数据,一维即可:MatrixXf testMat;float tt[] = {1.2, ...
2018-03-02 17:45:01
6463
1
翻译 强化学习介绍
两年前,伦敦的一家小公司DeepMind向Arxiv上传了他们的开创性论文“ Playing Atari with Deep Reinforcement Learning ”。在那篇文章中,他们演示了计算机是如何通过只观察屏幕像素,并在游戏得分增加时收到奖励这种学习模式去玩Atari 2600 视频游戏的。结果是显著的,因为每个游戏和每个游戏的目标是非常不同的,这些设计的游戏对人类而言也是不小的挑战
2017-03-21 17:14:38
10853
原创 Ubuntu16.04快速安装/更新Tensorflow
这里我们介绍的方式只是针对pip安装轮子版,并且博主是升级版本, 所以已经配置好了Cuda和cudnn,如果你没有配置过那么请先想办法 配置好再继续,或者你可以试试如下命令: $ sudo apt-get install libcupti-dev 这个是TF安装说明里说的,本人没试过。由于在国内直接用pip安装网速层次不齐,所以我们先更换pip源: 在 ~/.pip/pip.co
2017-02-18 13:18:02
4149
原创 Ubuntu上Inkscape实现Latex输入方法
写这篇文章作者的实现平台具体是Ubuntu16.04,方法有从网上参考,但可能平台有差异,修改后方可使用,这里给出所有步骤如下:步骤: * 安装 Texlive: sudo apt-get install texlive * 安装 inkscape: sudo apt-get install inkscape * 安装 pstoedit: sudo apt-get install pst
2017-02-17 19:12:18
2735
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人