tensorflow
heart_arsonists
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
policy gradient 在pendulum环境中的实现
这个policy gradient代码是在tensorflow的框架中完成的,并且是基于openai gym 中的pendulum环境。此代码有借鉴莫凡老师的相关代码。有必要记录的一点是关于 self.sample_op = tf.squeeze(self.pi.sample(1)), 当没使用 tf.squueze 时,总会出现关于state shape的报错。尽管此时state已经是(1,3)的shape,但是会报错说是(3,1,1)的shape。要记得使用tf.squeeze。import ten原创 2021-02-08 00:43:05 · 569 阅读 · 2 评论 -
tf.distributions.Categorical 工作原理
一般用法tf.distributions.Categorical(logits).log_prob(index)作为一个离散型分布,一个神经网络会输出分类数量长度的向量。举例,有4类,输出为[1,2,3,4]。我们想知道第三类(index 为 2)的log probability。此时只需将[1,2,3,4]作为参数logits,2作为参数index。其计算prob(index=2)=e3e1+e2+e3+e4=0.23688log_prob=log(0.23688)=−1.4402prob(in原创 2020-12-12 07:46:46 · 3451 阅读 · 1 评论 -
global_step不随训练变化
今天运行代码时发现,跑完后 loss 记录出现问题。相关代码如下,记录loss时调用了global_step。但结果global_step一直未随网络update变化。self.summaries = tf.summary.merge([ tf.summary.scalar("loss", self.loss), tf.summary.scalar("loss_state", self.loss_state), tf.summary.原创 2020-10-17 01:57:28 · 362 阅读 · 0 评论 -
将tensor转换成numpy
将tensor转换成numpysess =tf.Session() #定义一个sessionimage_decoded1=image_decoded1.eval(session=sess)这时候tensor就已经被成功转换,即可进行np的操作了。原创 2020-06-26 16:23:57 · 2729 阅读 · 0 评论
分享