- 博客(17)
- 收藏
- 关注
原创 STK实例场景创建及TLE文件导入
学习过程主要参考杨颖、王琦老师的《STK在计算机仿真中的应用》。(值得注意的是,书中的STK版本为5.X,我使用的版本为11.6)
2023-04-11 12:16:55
2572
原创 Self-Attention with Relative Position Representations
Hi,这是第四篇算法简介呀!论文链接:Self-Attention with Relative Position Representations,2018文章概述 Vaswani等人提出了只用注意力机制的Transformer,没有显式地建立相对位置或绝对位置信息的模型。这篇文章提出了一种有效地将相对位置表示纳入Transformer的Self-Attention中的方法。 在Tran...
2019-11-15 00:15:37
806
原创 SAC(Soft Actor-Critic)
Hi,这是第三篇算法简介呀论文链接:Soft Actor-Critic:Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor,2018,ICML文章概述 强化学习的两个主要挑战是高样本复杂性和收敛性脆弱。在这篇文章中,提出了一个基于最大熵框架的actor-critic离线策略的深度强化学...
2019-09-25 21:25:55
5138
翻译 [论文翻译]Actor-Attention-Critic for Multi-Agent Reinforcement Learning
Hi,论文翻译仅供参考,想了解细节还是建议阅读原文论文链接:Actor-Attention-Critic for Multi-Agent Reinforcement Learning引入注意力机制的Actor-Critic多智能体强化学习算法摘要 多智能体场景中的强化学习对于实际应用程序非常重要,但它带来的挑战超出了单智能体场景中的挑战。我们提出了一个在多智能体环境中分散训练策略的Act......
2019-09-23 22:40:33
4019
5
原创 DDPG(Deep Deterministic Policy Gradient)
Hi,这是第二篇算法简介呀论文链接:“Continuous control with deep reinforcement learning.” 文章概述公式理解伪代码分析试验结果分析代码实现
2019-09-18 02:10:12
2497
原创 DQN(Deep Q-Network)
Hi,这是第一篇算法简介呀论文链接: “Human-level control through deep reinforcement learning”.文章概述 本文首次提出了一种深度学习模型,利用强化学习的方法,直接从高维的感知输入中学习控制策略。 DL算法需要大量手工标记数据,而RL中从输入到获得reward信号存在稀疏、有噪声和延迟的问题。DL算法假设data是独立的;而在RL...
2019-09-16 20:29:41
745
原创 C语言:数组排序(插入排序、选择排序、泡排序、谢尔排序、快速排序、堆排序)
为什么排序?排序性能排序方法1. 插入排序2. 折中插入排序3. 谢尔排序4. 选择排序5. 泡排序6. 快速排序7. 堆排序
2017-01-11 00:42:52
1265
原创 编译原理:短语,简单短语,句柄,语法树
在文法和语言概念这里,比较难理解的是短语、简单短语,所以好好梳理一下。先给出短语、简单短语的概念:(备注:Vn代表非终结符号集,V+代表字汇表的正闭包,V*代表字汇表的闭包)所以,短语、简单短语都是针对某一句型的,是相对于某个非终结符号的,并且任何句型本身一定是相对于识别符号Z的短语。句柄:任一句型的最左简单短语称为该句型的句柄,一个句型只有一个句柄。所以,短语,简
2016-09-23 18:22:37
18732
转载 软件工程:传统软件工程 vs 敏捷软件开发
转自我的博客园文章:http://www.cnblogs.com/katniss-smile/p/5982643.html首先给出软件工程和敏捷软件开发的定义:软件工程(Software Engineering): 是一种层次化技术。 将系统化的、规范的、可量化的方法应用于软件的开发、运行和维护,即将工程化的方法应用于软件。 研究”建立和使用一套合理的工作原则,以便经济地获得可靠的
2016-09-22 09:08:33
4106
原创 PHP笔记1:php.ini文件配置
//使用的是windows10,PHP 7.0.10//下载php for windows的安装包(官网下载:http://windows.php.net/download/)//解压后,找到php.ini-development,重命名为php.ini//打开php.ini,记事本应该可以直接打开、编辑//增加php的扩展功能//ctrl+f 找到
2016-09-18 15:00:02
505
转载 Deep Learning in NLP (一)词向量和语言模型
我是为了mark一下。直接贴上原文链接: http://licstar.net/archives/328
2016-09-03 13:12:42
446
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人