
强化学习
文章平均质量分 55
AndrewGSD
通其变,天下无弊法;执其方,天下无善教。-隋·王通《中说·周公》
展开
-
指定GPU训练
给模型训练具体指定GPU。原创 2022-06-07 18:03:25 · 3184 阅读 · 1 评论 -
论文笔记:Safe Active Learning for Multi-Output Gaussian Processes
论文名称:Safe Active Learning for Multi-Output Gaussian Processes1.论文见此链接:Link2. 论文要点:1)、该文章利用高斯回归去帮助实现主动学习的safety exploration, 主要从公式(1)去原创 2022-04-04 22:41:34 · 2854 阅读 · 0 评论 -
安装mujoco出现问题总结
安装Mujoco可以根据此教程(https://blog.youkuaiyun.com/Youtian_/article/details/103841453),但是会出现问题,以下方案可以解决。出现的问题:1.ubuntu18 Could not build wheels for mujoco-py which use PEP 517 and cannot be installed directly2. error: command ‘gcc’ failed with exit status 13. err原创 2021-07-13 16:59:42 · 958 阅读 · 0 评论 -
tensorboard显示问题的解决No dashboards are active for the current data set和TensorFlow installation not foun
一、问题No dashboards are active for the current data set.之前是:tensorboard --logdir=dqn显示No dashboards are active for the current data set.的问题后来按照要求在后面加了:–bind_all最后的输入也就是:tensorboard --logdir=dqn --bind_all成功了,按照链接打开就行二、问题TensorFlow installation not f原创 2021-01-11 20:57:59 · 498 阅读 · 0 评论 -
强化学习库gym之mountain-car源码解读
一、导入相关需要的包import mathimport numpy as npimport gymfrom gym import spacesfrom gym.utils import seeding二、定义MountainCarEnv类,并且继承gym的env环境,在类中分别定义方法1、初始参数方法def __init__(self, goal_velocity = 0): self.min_position = -1.2 # 最小位置点 ..原创 2020-11-21 18:08:08 · 2277 阅读 · 0 评论 -
强化学习应用简述
强化学习 (reinforcement learning) 经过了几十年的研发,在一直稳定发展,最近取得了很多傲人的成果,后面会有越来越好的进展。强化学习广泛应用于科学、工程、艺术等领域。下面简单列举一些强化学习的成功案例,然后对强化学习做简介,介绍两个例子:最短路径和围棋,讨论如何应用强化学习,讨论一些仍然存在的问题和建议,介绍《机器学习》强化学习应用专刊和强化学习应用研讨会,介绍强化学习资料,回顾强化学习简史,最后,简单讨论强化学习的前景。一、成功案例我们已经见证了强化学习的一些突破,比如深度Q网转载 2020-11-11 21:20:20 · 5087 阅读 · 0 评论