自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 强化学习入门项目 Spinning up OpenAI (2) 基本使用

Spinning up包含下列算法VPGTRPOPPODDPGTD3SAC以上算法均应用了MLP的actor-critics,适用于fully-observed, non-image-based RL环境。POMDP即部分可观测MDP,non-image指的是非端到端 从图像输入到动作输出的过程。每个算法有两种实现(pytorch和tensorflow,TRPO只有tensorflow实现)为什么选择这些算法?我们选择了Deep RL近期领域的核心算法,尤其是PPO和SAC,在

2021-10-09 22:29:09 1531

原创 强化学习入门项目 Spinning up OpenAI (1) installation

Spinning up是openAI的一个入门RL学习项目,涵盖了从基础概念到各个baseline算法。在此记录一下学习过程。Spining Up 需要python3, OpenAI Gym,和Open MPI目前Spining up 只支持在linux的OSX上,先按照官方的教程走一遍流程。安装python通过anaconda安装pythonanaconda选择对应文件下载安装anaconda即可,通过conda创建环境conda create -n spinningup python=

2021-10-09 19:49:19 1098 1

转载 The achinevement of logistics regression

1 The achinevement of logistics regression1.1 mathmatics formulas​ picture 1.1 recognition processingsigmoid(wTx+b)=11+e−(wT+b)sigmoid(w^Tx+b)=\frac{1}{1+e^{-(w^T+b)}}si

2020-10-28 20:31:35 167

原创 LeetCode 链表 707.设计链表

题目来自LeetCode 链表 707.设计链表,很多地方易出错。注意各种边界条件、保持逻辑的严谨、#include<iostream>#include<string>using namespace std;typedef int ElementType;class Node {public: ElementType data; Node* next;};//定义结点类class MyLinkedList {public: Node*

2020-08-16 19:39:39 169

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除