- 博客(11)
- 收藏
- 关注
原创 Continual learning of context-dependent processing in neural networks
Continual learning of context-dependent processing in neural networks摘要:深度神经网络能够学习出输入输出之间的复杂的映射规则,但是这个规则是固定的,不能够学习出多种场景下的不同的映射规则并根据场景的采用这些规则。正交权重修正以及场景以来的处理模块能够有效的解决深度神经网络的这个限制使得深度神经网络能够适用于现实的多变场景并取得不错的效果。在(1)需要根据具体场景学习和采用相应映射规则;(2)不同的场景和规则是按照顺序来学.
2020-07-26 20:27:24
1022
原创 Reinforcement Learning, Fast and Slow
Reinforcement Learning, Fast and Slow摘要:深度强化学习已经取得很大成就,但是最大的缺陷在于样本数据的有效性低。主要有两种方法来解决这个问题:Episode Deep RL Meta RL深度强化学习样本数据的有效性低的原因梯度下降。需要对参数进行迭代更新直到收敛。学习率不能太大否则无法收敛,学习率太小则收敛速度慢。 弱偏置假设。机器学习模型都是要设定一个偏置假设即设定一个模型的假设空间(即假设模型的具体形式,参数未知),然后根据数据训练在这个空间中找
2020-07-26 20:23:30
539
原创 Reinforcement learning in artificial and biological systems
Reinforcement learning in artificial and biological systems摘要:生物系统和人工系统的研究之间已经有了相互联系的硕果累累的概念和想法。在人工智能领域的强化学习方面的早期的研究工作和进展都源至于Bush and Mosteller 两人在生物学方面研究的启发。最近,时序差分的强化学习对于理解多巴胺神经元的活动提供了一个有力的框架。在本文的综述中,我们将描述生物系统和人工系统在强化学习方面的最新研究工作和进展。我们主要关注两个学科之间的一些.
2020-07-26 20:19:17
296
原创 扩展欧几里得算法(求最大公约数与逆)
#include class GCD{ public: long long a1,a2; long long Gcd; long long u,v; // Gcd=this->gcd(a1,a2); public: /*long gcd(long a1,long a2){ if(a2==
2017-03-07 21:28:18
721
原创 德州扑克七张牌的比较(21次搜索)
#include #include#include#include//#includeusing namespace std;struct card{ int num; char ch;};//每张牌用面值跟花色来描述。class Compare_5_cards{ public: bitset cards[5]; //
2017-03-07 21:24:11
2967
原创 动态规划之钢条分割
问题描述:p(n): p[1],p[2],.....,p[n]表示钢条长度为1,2,.....,n时的价格。给定length长度的钢条如何分割或者不分割整条卖才能得到最大收益。#include #include#includeusing namespace std;int top_to_bottom(int *price,int * max_value,int n){ if
2017-03-07 21:18:49
405
转载 文件流,clear()函数的应用
清除文件流的状态考虑这样的程序,它有一个 vector 对象,包含一些要打开并读取的文件名,程序要对每个文件中存储的单词做一些处理。假设该 vector 对象命名为files,程序也许会有如下循环:// for each file in the vectorwhile (it != files.end()) {ifstream input(it->c_str()); //
2017-02-13 22:47:02
10085
转载 流状态
流的状态由 bad、fail、eof 和 good 操作提示。如果 bad、fail 或者 eof中的任意一个为 true,则检查流本身将显示该流处于错误状态。类似地,如果这三个条件没有一个为 true,则 good 操作将返回 true。clear 和 setstate 操作用于改变条件成员的状态。clear 操作将条件重设为有效状态。在流的使用出现了问题并做出补救后,如果我们希
2017-02-13 22:11:36
816
转载 const 成员函数
const 成员函数的引入现在,可以理解跟在 Sales_item 成员函数声明的形参表后面的 const 所起的作用了:const 改变了隐含的 this 形参的类型。在调用total.same_isbn(trans) 时,隐含的 this 形参将是一个指向 total 对象的const Sales_Item* 类型的指针。就像如下编写 same_isbn 的函数体一样://
2017-02-13 22:05:07
379
转载 指向函数的指针
7.9. 指向函数的指针函数指针是指指向函数而非指向对象的指针。像其他指针一样,函数指针也指向某个特定的类型。函数类型由其返回类型以及形参表确定,而与函数名无关:// pf points to function returning bool that takes two const stringreferencesbool (*pf)(const string &, const
2017-02-13 22:00:29
356
转载 stringstream用法
1 std::string name("12345");2 int age = 27;3 stringstream os;4 os 5 os >> age;6 // age = 123457 cout 1 std::string name("12345");2 int age = 27;3 stringstream o
2017-02-13 21:54:29
310
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人