自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 python matplotlib笔记大全

matplotlib笔记大全## 设置数值from matplotlib import pyplot as pltx = range(2, 26, 2) y = [2, 5, 3, 9, 5, 3, 4, 8, 6, 4, 2, 1]'''新建一个画布''' # figsize:图片宽和高,dpi:q清晰度plt.figure(1, figsize=(20,8), dpi=80) plt.subplot(2,2,1) # 子图两行两列第一个# 画折线图plt.plot(x,y,c

2020-08-20 16:30:43 217

原创 机器博弈游戏规则 德扑和德扑变种

机器博弈游戏:leduc游戏规则术语HULH:(heads-up limit Texas hold’em)FHP:flflop hold’em pokerNLLH (No-Limit Leduc Hold’em )术语raise:也就是加注,就是当前决策玩家不仅将下注总额保持一致,还额外多加钱。(比如池中玩家一共100,玩家二50,玩家二现在决定raise,下100。此时池中玩家一共100,玩家二150。)call:也就是跟注或者pass,即当前决策玩家决定下注总额保持和另一个玩家一致。(情景一:如果

2020-06-27 13:14:26 2609

原创 坐标系转换

连续的左边转换如果以坐标系 (oxyz)a(oxyz)_{a}(oxyz)a​ 为基准,连续进行转动,坐标系中有一固定矢量λ\lambdaλ,随之一起转动,先绕 (oz)a(oz)_{a}(oz)a​ 轴转过角度 φ\varphiφ ,得到过渡坐标系 (oxyz)bφ(oxyz)_{b\varphi}(oxyz)bφ​,再绕 (oy)bφ(oy)_{b\varphi}(oy)bφ​ 轴转过角度 θ\thetaθ,得到另一过度坐标系 (oxyz)bθ(oxyz)_{b\theta}(oxyz)bθ​ ;再绕

2022-02-15 17:02:10 1027

原创 飞机坐标系转换

坐标系的定义及坐标系之间的转换是建立运动学、动力学模型的基础下面来解释一下地面坐标系和航迹坐标系的区别

2022-02-15 16:28:48 3693

原创 强化学习empowerment

强化学习 赋能 empowerment

2022-02-09 11:13:00 277

原创 信息熵的概念和例子

信息熵的释意和例子

2022-02-09 11:06:43 1698

原创 深度强化学习,解决稀疏奖励的ICM详解

深度强化学习ICM详解

2022-02-08 16:19:23 3395

原创 使用tensorflow快速搭建 DQN环境

使用tensorflow简洁快速的搭建DQN神经网络,只有建立网络、使用网络和训练网络三个代码,结构清楚

2021-12-13 11:07:40 2883 2

原创 卷积神经网络基本概念

卷积神经网络(1)输入层:将每个像素代表一个特征节点输入到网络中(2)卷积层:主要目的是使原信号特征增强并降低噪音(下图)(3)池化层(降采样层):降低网络训练参数及模型的过拟合程度(4)全连接层:对生成的特征进行加权(5)softmax层:获得当前样例属于不同类别的概率卷积层:图像矩阵和权值矩阵的点乘卷积操作相对于全连接的优点的优点:①局部连接:每个输出特征不用查看每个输入特征,值需要查看与卷积核相乘的这部分输入特征;②:权值共享:卷积核在图像上滑动过程中保持不变。(3*3的卷积核,所需

2021-02-04 11:19:23 249

原创 tensorflow 网络的保存和读取

模型的保存1 初始化文件目录和参数2 声明saver3 训练模型(见笔记)4 储存网络# 创建目录import os ckpt_dir = './save_net/' # 文件目录if not os.path.exists(skpt_dir): os.makedirs(sklt_dir)# 存储文件的粒度save_skpt = 5 # 每5次保存一次#在tensorflow中 声明一个saversaver = tf.train.Saver() # 保存网络模型

2021-01-17 21:00:18 309

原创 tensorflow 网络构建和使用笔记

one-hot的意义: 比如:0-9如果不用杜热编码,在欧氏距离上,1和3比8和3更接近,但实际上并不是这样,因此用独热编码就能很好的打破这种联系。 如何读取呢:argmax np.argmax(x_data[0]) #返回最大数的索引 # 或在tensorflow中 tf,argmax(x_data,0) # 按行取值,即同列的每一行取最大 tf.argmax(x_data,1) # 按列取值,即同列的每一行取最大例如:arr1 = np.array([1,3,2,5,7,0])a

2021-01-17 20:27:37 98

原创 Tensorboard 显示问题

import tensorflow as tf# 第一步:清楚default graph 和不断增加的节点tf.reset_default_graph()#第二步:设置logdir路径,计算图信息保存在这个日志里logdir = 'D:/log'# 第三步,定义简单的计算图with tf.variable_scope("try"): w = tf.Variable(tf.random_normal([12, 1], stddev=0.01), name="W") b = tf

2021-01-17 11:10:11 327

原创 数据分析之EXCEL命令

学习数据分析之EXCEL命令绝对值:ABS(number) 例:=ABS(A2)返回逻辑值:AND(logical1,logical2, …) 例:=AND(A5>=60,B5>=60)算术平均数:AVERAGE(number1,number2,……) 例:=AVERAGE(B7:D7,F7:H7,7,8)列表号值:COLUMN(reference) 例:在B11单元格中输入公式:=COLUMN()行表号值:row()连在一起:CONCATENATE(Text1,Tex

2020-08-20 16:54:43 346

原创 莫烦python sklearn笔记

莫烦python sklearn笔记莫烦python bilibili视频视频时长一个小时,下面是分模块整理的笔记,需要哪块就复制就可以用走过路过的仙女仙子,有用记得点个赞哦安装python3.6:先安装numpy、scipy,再安装 scikit-learn各个命令的库调用from sklearn import datasets # sklearn自带数据集from sklearn.model_selection import learning_curve # 验证过拟合l

2020-08-20 16:48:10 262

原创 DeepStack算法笔记

DeepStack算法笔记Deep Stack 中游戏树介绍:游戏规则整体算法网络结构伪代码Solving Imperfect Information Games Using DecompositionDeep Stack 中游戏树介绍:Deep Stack 的re-solving需要保留自己的range和对手的遗憾值这两个值Deep Stack 的核心是不保留记忆,采用局部搜索,将游戏分成一个个的子博弈,这样是为了省空间且加速算法。下面介绍该算法的游戏规则、核心算法、网络、伪代码。游戏规则

2020-07-03 11:30:49 3360 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除