- 博客(3)
- 收藏
- 关注
原创 DDPG算法实现multiple particle env的‘simple’ scenario
simple简介: simple是multi particle envs(mpe)中最简单的一个环境,旨在测试算法和熟悉环境,我在mpe中使用DDPG算法完成了单智能体的navigation的功能。 DDPG算法是基于AC算法的改进版本,加入了target网络保证收敛,同时可以输出连续动作,具体不再赘述,不懂可以去看莫烦老师的强化学习教程 下面看代码 # -*- coding: utf-...
2019-02-26 10:27:54
1177
1
转载 tensorflow中feed_dict不一定与placeholder绑定
在tensorflow的初学者看来,feed_dict是与placeholder绑定的,如下 import tensorflow as tf a = tf.placeholder(dtype=tf.float32) b = tf.placeholder(dtype=tf.float32) c = tf.add(a, b) with tf.Session() as sess: pri...
2019-02-25 10:55:01
486
原创 决策树Python实现代码
引用数据集获取: 西瓜数据集2.0获取 程序: # -*- coding: utf-8 -*- """ Created on Sun Jan 6 23:02:02 2019 @author: Jack Lee """ import math def createDataSet(): dataSet = [ # 1 ['青绿', '蜷缩', ...
2019-01-08 18:12:38
755
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人