- 博客(4)
- 收藏
- 关注
原创 强化学习入门项目 Spinning up OpenAI (2) 基本使用
Spinning up包含下列算法VPGTRPOPPODDPGTD3SAC以上算法均应用了MLP的actor-critics,适用于fully-observed, non-image-based RL环境。POMDP即部分可观测MDP,non-image指的是非端到端 从图像输入到动作输出的过程。每个算法有两种实现(pytorch和tensorflow,TRPO只有tensorflow实现)为什么选择这些算法?我们选择了Deep RL近期领域的核心算法,尤其是PPO和SAC,在
2021-10-09 22:29:09
1531
原创 强化学习入门项目 Spinning up OpenAI (1) installation
Spinning up是openAI的一个入门RL学习项目,涵盖了从基础概念到各个baseline算法。在此记录一下学习过程。Spining Up 需要python3, OpenAI Gym,和Open MPI目前Spining up 只支持在linux的OSX上,先按照官方的教程走一遍流程。安装python通过anaconda安装pythonanaconda选择对应文件下载安装anaconda即可,通过conda创建环境conda create -n spinningup python=
2021-10-09 19:49:19
1098
1
转载 The achinevement of logistics regression
1 The achinevement of logistics regression1.1 mathmatics formulas picture 1.1 recognition processingsigmoid(wTx+b)=11+e−(wT+b)sigmoid(w^Tx+b)=\frac{1}{1+e^{-(w^T+b)}}si
2020-10-28 20:31:35
167
原创 LeetCode 链表 707.设计链表
题目来自LeetCode 链表 707.设计链表,很多地方易出错。注意各种边界条件、保持逻辑的严谨、#include<iostream>#include<string>using namespace std;typedef int ElementType;class Node {public: ElementType data; Node* next;};//定义结点类class MyLinkedList {public: Node*
2020-08-16 19:39:39
169
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人