hdsfjk-优快云博客

原创 Autonomous Reinforcement Learning via Subgoal Curricula 论文笔记

题目：基于子目标课程的自主强化学习 Abstract 无 1 Introduction 强化学习为交互式智能体自主获取复杂行为提供了很好的契机，但当前强化学习算法的自主性仍面临挑战，尤其是在机器人领域：假设每次试验都从环境中特定状态分布的初始状态开始。传统地，强化学习算法假设能够任意采样并重置为从该分布中提取的状态，这使得此类算法对于大多数实际设置都不切实际。许多以前在真实机器人上进行强化学习的例子都依赖于机器人设置和人类监督的仪器，以使环境重置为该初始状态分布。额外的环境检测和创建脚本化行为都需要大量

2022-05-23 18:58:38 238

原创 MULTIPOLAR: Multi-Source Policy Aggregation for....论文笔记

MULTIPOLAR: Multi-Source Policy Aggregation for Transfer Reinforcement Learning between Diverse Environmental Dynamics 论文翻译笔记聚类是一种机器学习算法！！题目：多极：多源策略聚合，用于不同环境动态/环境动力学之间的迁移强化学习 Abstract 迁移强化学习（Transfer Reinformation learning，RL）：通过利用其他来源的agent在相关任务中的知识来提高

2022-05-19 19:14:34 223 1

原创 Maddpg代码配置 Anaconda MPE

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、安装前准备二、开始配置前言记录下配置Maddpg所需环境及代码运行过程中遇到的问题。一、安装前准备下载maddpg和mpe环境安装包. maddpg:(网盘链接)https://pan.baidu.com/s/1Q0XYyUHTTKdxdqSSudXFuw?pwd=0hu5 提取码：0hu5 mpe:（网盘链接）https://pan.baidu.com/s/1lUDphlyhKualaOyFUkNNag?pwd.

2022-05-09 22:28:33 1401

原创括号匹配 C语言

括号匹配 c语言 #include<stdio.h> #include<string.h> int main() { int n,m; char s[100]; char copys[100]; scanf("%d%*c",&n); while(n–) { gets(s); int i,j=0,k; int flag=0; int len=strlen(s); for(i=0;i<len;i++) {if((s[i]’(’)||(s[i]’[’)||(s[i]’{

2021-03-16 20:48:13 208 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 Autonomous Reinforcement Learning via Subgoal Curricula 论文笔记

原创 MULTIPOLAR: Multi-Source Policy Aggregation for....论文笔记

原创 Maddpg代码配置 Anaconda MPE

原创 括号匹配 C语言

空空如也

空空如也

原创括号匹配 C语言