- 博客(16)
- 收藏
- 关注
原创 双轮机器人通过spinningup在mujoco中测试记录(更新)
1、 在我们这个游戏中,我们的状态由 4 个数字组成:底部小车的位置,小车的速度,杆的位置(以角度表示)和杆的角速度。这 4 个数字都是给定的数组(或向量)理解状态是一个数字数组意味着我们可以对它进行一些数学运算来决定我们根据状态采取什么行动。2、 点积两个数组(向量)之间的点积简单地将第一个数组的每个元素乘以第二个数组的对应元素,并将它们全部加在一起。假设我们想找到数组 A 和 B 的点...
2019-07-15 09:09:15
323
原创 策略迭代:二维状态网格实现
#参考:https://www.cnblogs.com/devilmaycry812839668/p/10314049.html#encoding:UTF-8#!/usr/bin/env python3import random#状态states=[0,1,2,3,4,5]#动作actions=["a", "b"]# 奖励的折扣因子gama=0.9""" 状态值 v...
2019-06-17 22:03:24
373
原创 spinningup安装报错
failed building wheel for box2d-py1、http://www.swig.org/download.html 中下载 swigwin-3.0.12,解压缩到指定路径。将路径添加到环境变量2、pip install box2d-py3、再次安装spinningup即可...
2019-06-05 20:22:22
800
原创 github使用
1、创建库2、下载库到本地,指定目录:git clone https://github.com/zhenshangxue/RL.git3、将文件复制进该目录RL中,git status 查看4、然后 git add --all 将新添文件添加到库,如果想添加某一个文件,则将后面的–all换成你要提交的文件名即可5、然后还需要将增加的文件commit到仓库里去,执行命令git comm...
2019-05-23 09:29:44
164
原创 强化学习中:神经网络与梯度下降
这里的关系是,主要用强化学习方法控制cartpole,同时由于是连续状态动作,所以用到了神经网络来拟合策略函数,策略梯度在这里的作用,是对神经网络的参数进行更新,是更新参数的一种方法。1,此处用到三层神经网络:输入层,隐藏层,输出层因为此处需要输出的动作只有三个,所以相当于用神经网络对动作进行分类,分类一般用softmax函数(激活函数:因为不加激活函数时,神经网络是线性的,处理问题能力有限)...
2019-05-22 11:05:12
980
转载 嵌入式
嵌入式嵌入式开发就是指在嵌入式操作系统下进行开发,一般常用的系统有WinCE,ucos,vxworks,linux,android等。另外,用c,c++或汇编开发;用高级处理器,arm7,arm9,arm11,powerpc,mips,mipsel等,或加上操作系统也属于嵌入式的开发。通俗点就是:把操作系统剪裁剪裁,移植到对应的硬件里。比如把一个播放器移植到mp3那个硬件里,这个所需要的技术,...
2019-04-26 18:20:12
381
原创 tensorflow错误日志
1.tensorboard可视化错误解决办法在最代码顶部添加import osos.environ[‘TF_CPP_MIN_LOG_LEVEL’] = ‘2’即可可视化命令(logs是指定位置,自定义)然后会出现连接这里是http://PC:6006还有一个问题这里好像ie和百度都无法打开链接,用的火狐正常...
2019-01-15 15:38:47
2515
原创 数据库基础随记
东流:SELECT User, Host, Password FROM cloudsql.user;查看所有用户东流:CREATE USER ‘cloudsql’@‘localhost’ IDENTIFIED BY ‘cloudsql’;创建用户东流:ln -s 现在地址 目标文件地址东流:rm -rf 目标...
2019-01-04 18:41:41
132
转载 Ubuntu16.04LTS下搭建强化学习环境gym、tensorflow
https://blog.youkuaiyun.com/ms961516792/article/details/79122914
2018-12-05 11:31:35
426
原创 正则表达式在NPL中的应用,匹配字符串
import retext_string=‘重阳节,为每年的农历九月初九日。是中华民族的传统节日。《易经》中把“九”定为阳数。是九月九日。两九相重,故曰“重阳”。因日与月皆逢九,故又称为“重九”。九九归真,一元肇始,古人认为九九重阳为吉祥之日。’regex=’^是’p_string=text_string.split(’。’)for line in p_string:if re.sear...
2018-10-17 11:10:55
269
原创 python1
python面向对象构造函数 init析构函数 del两种函数都没有返回值所有类都是object类的子类eg:class BaseClass(object): #父类的定义block_classclass SubClass(BaseClass): #子类的定义block_class...
2018-10-15 14:05:20
278
原创 Request通过pip安装
打开python安装目录下的scripts文件夹此处打开cmd,或者进入cmd后找到此路径,命令行输入pip install requests等待完成
2018-10-12 17:11:50
7405
2
原创 pygame通过pip安装
pygame下载地址,选择与python对应版本https://bitbucket.org/pygame/pygame/downloads/上边没有的话,试试下面下载地址http://www.lfd.uci.edu/~gohlke/pythonlibs/#pygame若是.exe文件可直接安装。若是.whl文件,下载到python项目文件目录,打开cmd切换到该目录输入指令pytho...
2018-10-12 16:47:35
645
原创 随手笔记
git status 查看更改git add . 通知添加到库git commit –m “name” 添加到库git push 上传git log 查看提交日志记录上传文件时grep: /…/Utilities/SetupForDevelopment.sh: No such file or directory 报错进入.git目录 删除hooks目录修改config配置,将关...
2018-10-08 13:40:21
144
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人