- 博客(23)
- 资源 (4)
- 收藏
- 关注
原创 Dueling DQN 值函数和优势函数
定义advantage,动作的优势程度函数将Q网络分成两个通道,一个输出V,一个输出A,最后再合起来得到QQ(s,a) = 状态的所有动作Q期望 + action-value的优势程度(思考优势程度的定义)Q(s,a) = A(s,a) + V(s)1.值函数V(s)定义: 状态s下所有动作价值的期望(矩阵size=1)2.优势函数A(s,a)避免两个支路直接学习到V(s)=0或者A(s,a)=0的情况===>优势函数(Advantage Function)定义优势函数.
2020-09-16 15:37:22
2448
原创 Double-DQN算法target网络和predict网络区别
DQN框架主要包括以下几部分:构建predict神经网络和target神经网络模块训练predict神经网络模块更新target神经网络模块根据predict值选择动作模块DQN算法图如下:这里存在两个Q值神经网络:predict神经网络和target神经网络。1. target神经网络。作用:计算目标Q值。更新:间隔一段时间进行更新。目的:保持算法稳定性。为了获得的Q值,Q值的更新依靠Reward和Q计算出来的目标Q值:这里采用一个稳定的target神经网络进行Q值..
2020-09-16 14:20:10
2607
原创 deepin 系统 Mujoco安装
安装mujoco以及mujoco_py的过程,安装版本mujoco200_linux和mujoco_py2.0.2.31. 安装环境deepin 15.11cuda 8.0cudnn 7.6.5python3.6tensorflow 2.3.0gym 0.17.22. mujoco安装(1)去Mujoco官网下载mujoco200_linux。(2)在home目录下创建隐藏文件夹mujoco,并将刚才下载好的安装包解压到这个文件夹下。mkdir ~/.mujococp m
2020-09-11 10:32:54
281
原创 anaconda 环境重复利用
复制环境老环境到新的环境中conda create --name new_env_name --clone old_env_name注意这里可以重复利用以前环境,省去了每次配置的时间
2020-09-10 17:24:29
489
原创 PyCharm虚环境设置
PyCharm可以使用virtualenv中的功能来创建虚拟环境。PyCharm紧密集成了virtualenv,所以只需要在setting中配置即可创建虚拟环境。而且PyCharm捆绑了virtualenv,我们不需要单独安装。一般创建过程如下:1. 进入Project Interpreters页面文件(file)——>设置(setting)——>项目(Project)——>Project Interpreters点击图片中红框 选择 --- Add Local......
2020-09-10 17:22:42
254
原创 Anaconda虚拟环境设置
Anaconda虚拟环境1、创建环境conda create --name your_env_name python=3.6或者conda create -n your_env_name python=3.7新建一个环境2、查看环境进入Anaconda Prompt,使用conda info -e查看所有环境和当前环境3、激活环境使用activate py36激活虚拟环境4、复制环境老环境到新的环境中conda create --name new_env_name --.
2020-09-10 17:21:17
433
原创 deepin安装docker方法
deepin 15.11 安装docker,进行开发。Docker官网上并没有提供关于Deepin的 Docker 安装教程,由于Deepin是基于Debian的,所以可以参照官网Debian的安装教程安装,但Deepin在定制过程中进行了大量修改,所以使用官方教程可能会失败,所以这里记录下Deepin下的 Docker 安装。一.认识 Docker简介:Docker 是一个开源的应用容器引擎,提供了一种能够让应用程序相互隔离地、安全地运行在容器中的方法且其包含了应用程...
2020-09-02 17:24:12
1243
原创 deepin15.11 通过更新系统升级gcc 7的方法和经验
Deepin15.11已安装GCC6.5,在升级安装GCC7.2时遇到很多问题。本文总结和分享安装GCC7.2的经验和安装方法。一、 遭遇的问题sudo apt-get upgrade 没有gcc7 ,无法自动升级。二、解决方案解决:重设系统更新源,用sudo apt-get update和sudo apt-get upgrade更新系统,此时gcc被升级为7.3.0。(注意:更新完后可能显示存在一些未更新问题,再使用 sudo apt-get update --fix-missing和su
2020-09-02 10:23:06
612
转载 Deepin15.11手动升级GCC8.3方法和经验
转载https://blog.youkuaiyun.com/subfate/article/details/42805193Deepin15.11手动升级GCC8.3方法和经验2019年准备跨平台开发一开源项目需要stdc++14,因此选择采用Deepin+GCC8.3+Eclipse CDT搭建开发环境。Deepin15.11已安装GCC6.0.3,在升级安装GCC8.3时遇到很多问题。本文总结和分享安装GCC8.3的经验和安装方法。一、 遭遇的问题1、 生成GCC-8.3.0 make -j4.
2020-09-02 09:54:16
656
原创 python numpy 版本问题:error module compiled against API version 0xc but this version of numpy is 0xb
问题描述:安装完gym之后,又安装了一些其他包,之后再使用gym出现如下错误:RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb在这里,依赖的是0xc而我的是0xb然后我就用下面命令查了一下我的numpy文件的版本pip show numpy查看numpy路径>>> print(np.__path__)打印出[‘G:\ProgramD.
2020-09-02 09:16:54
6507
4
转载 关于jupyter notebook密码设置
关于jupyter notebook密码设置对于一个jupyter编辑器使用的新手,更换浏览器或者Logout后,需要输入密码进行登陆时按照网上的教程怎么设置都不行,那么自己整理了一个适用于初学者的操作。1.windows下,打开命令行,重新生成一个jupyter配置文件: 1 jupyter notebook--generate-config ...
2019-04-24 09:18:58
506
原创 Julia Debugger 调试
安装uber-juno1 - 采用using Revise 和includet(file)设置debugger的断点,否则报错。2 - 采用kickstart the debugging 通过 “main” function, 在Juno REPL输入Juno.@enterorJuno.@run运行相应函数。如何在Juno上使用调试器...
2019-04-12 14:19:11
1761
转载 Julia开发环境搭建(Julia+Atom+Gallium)
Julia开发环境搭建(Julia+Atom+Gallium)wangww29关注0.22018.09.29 14:36*字数 853阅读 662评论 0喜欢 3 这两天看了一篇论文,作者提供了用Julia实现的算法源代码,所以顺手搭个环境复现一下结果,这里将那些踩过的坑记录下来。 Julia号称“Walks like Python, runs l...
2019-04-12 09:26:21
915
原创 Julia Dict操作
Julia 中的字典(Hash/Map)结构, 名为 Dict, 与 Python 中的名字一致.但 Julia 可以是强类型的, 所以其 Dict 的定义有着 C++ 的 Template 的特性. 定义原型如下:Dict{KeyType, ValueType}其中 KeyType 指定字典的 Key 的数值类型, 而 ValueType 指定值的类型. 类型可以是内置的(built...
2019-04-08 13:11:44
575
转载 Julia 更新包
julia> Pkg.add("Currencies")This command will install not only the package itself, but also all of its dependencies.If the installation is successful, you cantest that the package works prop...
2019-04-08 09:18:02
2075
转载 Julia 开发扩展包
开发扩展包Julia 中设有包管理器,当你安装了扩展包时,你可以看到它的源代码和完整的开发历史。你也可以修改扩展包,并使用 git 提交它们,为修复和增加扩展包功能做贡献。相似地,这个系统设计用来当你想要创建一个新扩展包时,最简单的方法就是利用包管理器中提供的基础设施。初始化设置由于扩展包存储于 git 仓库中,所以在做扩展包开发之前,你需要先设置如下全局 git 配置: ...
2019-04-04 18:01:57
837
转载 Julia发布全功能调试器:4大新功能问世
Julia发布全功能调试器:4大新功能问世量子位 出品 | 公众号 QbitAIJulia这门语言,因为集合了C语言的速度、Ruby的灵活、Python的通用于一身,获得了万千程序员的喜爱。福利来了~Julia团队又发布了新的全功能调试器,可以以多种姿势调试代码,节省你的工作量。有了这个新调试器的加持,你可以用Julia完成此前达不到的惊奇效果,包括:直接进入函数...
2019-04-04 17:09:44
360
原创 Julia本地离线安装git 上 package
首先,解决怎么安装其他包问题,这里以test为例1 - 将test以git clone下载注意一定要包含.git文件夹2. 然后add 文件夹位置3.成功!
2019-04-04 16:56:21
2735
1
原创 Julia 安装 Cplex
CPLEX.jl is an unofficial interface to theIBM® ILOG® CPLEX® Optimization Studio. It provides an interface to the low-level C API, as well as an implementation of the solver-independentMathProgBasea...
2019-03-30 21:13:13
1131
原创 Julia 编译JuMP Cbc安装错误
Error building Cbcjulia> Pkg.build("Cbc") WARNING: Base.Pkg is deprecated, run `using Pkg` instead in module Main Building LibCURL ─→ `C:\Users\Chiebuka\.julia\packages\LibCURL\OoXMv\deps\build.l...
2019-03-29 17:55:58
746
1
转载 JuMP: 用Julia进行优化建模及求解- 覃含章的文章 - 知乎 https://zhuanlan.zhihu.com/p/40807662
JuMP: 用Julia进行优化建模及求解 - 覃含章的文章 - 知乎 https://zhuanlan.zhihu.com/p/408076620. 为什么要用Julia做优化?本文是我在Julia中文社区2018用户见面会上关于用Julia进行优化建模及求解的分享内容。本Tutorial主要介绍JuMP.jl,一种在Julia语言中的开源AML(Algebraic Modeling...
2019-03-28 16:41:28
4429
原创 julia 安装JuMP和Cplex
Installing JuMP¶At first add the JuMP package by running the following code in the notebook:In[2]:Pkg.add("JuMP")INFO: Nothing to be doneWe need to install a solver package. Let's insta...
2019-03-28 16:26:12
3098
Optimal control of an HVAC system using cold storage
2015-04-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人