
科研
文章平均质量分 67
论文记录加分享
Sudaa__
学习、分享、进步
展开
-
Laxtex、Markdown 中实现极限、max等下标约束(正下方下标)
实现Laxtex、Markdown语法中极限、max等下标约束,即在正下方加下标。原创 2022-03-22 11:24:14 · 4078 阅读 · 0 评论 -
时间差分算法(TD Learning)(Sarsa、Q-Learning、Multi-Step TD Target)
时间差分算法(TD Learning)学习笔记,包括三部分内容:Sarsa、Q-Learning、Multi-Step TD Target原创 2022-03-22 11:06:13 · 2994 阅读 · 0 评论 -
Zotero 6.0 降级 5.x
Zotero 6.0 降级 5.x 版本。原创 2022-03-19 17:23:09 · 4262 阅读 · 10 评论 -
深度强化学习(4): Actor-Critic 方法篇
深度强化学习_王树森(4. Actor-Critic 方法篇)学习笔记。原创 2022-03-16 20:57:15 · 1025 阅读 · 0 评论 -
深度强化学习(3):策略学习篇
深度强化学习_王树森(策略学习篇,Policy-Based Reinforcement Learning)学习笔记原创 2022-03-16 12:22:54 · 2285 阅读 · 3 评论 -
深度强化学习(2):价值学习DQN篇
深度强化学习_王树森(2. 价值学习DQN篇)学习笔记。原创 2022-03-14 13:57:18 · 6223 阅读 · 0 评论 -
深度强化学习(1):基础知识篇
王树森老师《深度强化学习基础》(1. 基础知识篇)学习笔记原创 2022-03-12 18:45:59 · 2116 阅读 · 0 评论