
强化学习
牛蛙爹爹
这个作者很懒,什么都没留下…
展开
-
tensorflow tf.name_scope tf.variable_scope 配合get_collection使用时的区别
name_scope和variable_scope 在定义tensor的时候都会在name前面加上前缀,但是在使用 tf.get_collection(tf.GraphKeys.TRAINABLE_VARIABLES, scope=scope) 的使用之后配合variable_scope才能获得对应的tensor list。 例如 with tf.variable_scope(scop...原创 2019-12-19 18:50:20 · 514 阅读 · 0 评论 -
STANFORD RL CS234 第一次作业总结
1 Optimal Policy for Simple MDP (a) 等比数列取极限。 (b)官方解答已经很清楚了 solution: If γ > 0, value of γ does not change the ordering of states, so the optimal policy is the same; however, the value of the val...原创 2019-11-05 16:00:18 · 1547 阅读 · 4 评论