
人工智能/强化学习
人工智能,深度学习,强化学习
溪云初起,山雨欲来
控制工程
展开
-
多智能体强化学习环境
多智能体强化学习环境环境是强化学习的核心要素之一。不同的环境一直是研究新的强化学习算法的动力。但是让智能体和真实环境交互的代价是很大的,不但费时费力,甚至有的时候根本不可能进行交互。现在的多智能体强化学习和强化学习早期境遇很像,只有较少的环境可用。另外在不同的智能体之间分享信息的设置范围可能很广,有些环境涉及通信,有些共享联合奖励,有些共享全局状态。StarCraft作为一款复杂的即时战略...原创 2020-03-20 21:54:09 · 4232 阅读 · 5 评论 -
多智能体强化学习的相关论文
书籍2018-Deep Multi-Agent Reinforcement Learning2014-Multi-Agent Machine Learning: A Reinforcement Approach综述2008-A comprehensive survey of multiagent reinforcement learning2019-A survey and critiq...原创 2020-04-18 18:58:47 · 2810 阅读 · 1 评论 -
强化学习的简单介绍
强化学习学习资源强化学习是机器学习的三大分支之一,与其他两个分支不同的是,监督学习与无监督学习专注于预测(辅助医生诊断),而强化学习专注于决策(直接提出治疗方案)。换句话说,强化学习是让AI做完一切事情,而不只是一个辅助!学习强化学习的过程就是强化学习,因为要不断试错。引言序列决策只要是序列决策问题,都可以用强化学习来解决。如果是单步决策问题,那么和预测问题没什么区别,可直接使用监督学习或无监督学习解决。定义智能体通过与环境进行交互学习来实现目标的计算方法目标智能体找到一个最优策略来使得原创 2020-05-24 20:39:38 · 524 阅读 · 0 评论 -
《多智能体学习:强化学习方法》——代码实现
文章目录Nash-QLearning智能体创建一个矩阵环境策略训练Minimax-QLearning¶WoLF-PHC(Policy hill-climbing algorithm)Nash-QLearning论文:Nash Q-learning for general-sum stochastic games链接:http://www.jmlr.org/papers/volume4/hu0...原创 2020-05-03 15:12:49 · 8422 阅读 · 4 评论 -
Retro-用于强化学习智能体训练的各种有趣的游戏环境集合
https://openai.com/blog/gym-retro/原创 2020-04-29 17:00:06 · 3403 阅读 · 9 评论 -
基于图注意力神经网络的多智能体博弈抽象
G2ANet《Multi-Agent Game Abstraction via Graph Attention Neural Network》关键词:大规模,博弈抽象,2级(硬+软皆有)注意力机制,图神经网络通过简化策略学习过程解决了大规模智能体的问题。贡献1.用完全图来建模(构建)智能体之间的关系。因为大规模的智能体场景中不是每个智能体都相互作用的,我们需要确定关系(交互还是不交互?)...原创 2020-03-29 16:56:46 · 3236 阅读 · 0 评论 -
强化学习与深度学习资源
书籍推荐《Reinforcement Learning:An introduction》——圣经,有中文版《Algorithms for RL》《深入浅出强化学习:原理入门》OpenAI深度强化学习 Spinning Up 项目中文版Gym环境入门视频莫烦周博磊David Silver李宏毅进阶视频伯克利大学CS 294-112 《深度强化学习课程》...原创 2020-03-29 17:25:44 · 800 阅读 · 0 评论 -
有趣的人工智能项目合集,如老婆生成器
有趣的人工智能项目合集老婆生成器1:https://waifulabs.com/老婆生成器2:https://make.girls.moe/二次元角色故事背景生成器:https://www.thiswaifudoesnotexist.net/面部动态论文:https://arxiv.org/abs/1905.08233v1陶瓷瓶生成:https://thisvesseldoesnotexist.com/室内设计生成:https://thisrentaldoesnotexist.com/照片去原创 2020-07-18 15:45:50 · 6887 阅读 · 1 评论