自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Continual learning of context-dependent processing in neural networks

Continual learning of context-dependent processing in neural networks摘要:深度神经网络能够学习出输入输出之间的复杂的映射规则,但是这个规则是固定的,不能够学习出多种场景下的不同的映射规则并根据场景的采用这些规则。正交权重修正以及场景以来的处理模块能够有效的解决深度神经网络的这个限制使得深度神经网络能够适用于现实的多变场景并取得不错的效果。在(1)需要根据具体场景学习和采用相应映射规则;(2)不同的场景和规则是按照顺序来学.

2020-07-26 20:27:24 1022

原创 Reinforcement Learning, Fast and Slow

Reinforcement Learning, Fast and Slow摘要:深度强化学习已经取得很大成就,但是最大的缺陷在于样本数据的有效性低。主要有两种方法来解决这个问题:Episode Deep RL Meta RL深度强化学习样本数据的有效性低的原因梯度下降。需要对参数进行迭代更新直到收敛。学习率不能太大否则无法收敛,学习率太小则收敛速度慢。 弱偏置假设。机器学习模型都是要设定一个偏置假设即设定一个模型的假设空间(即假设模型的具体形式,参数未知),然后根据数据训练在这个空间中找

2020-07-26 20:23:30 539

原创 Reinforcement learning in artificial and biological systems

Reinforcement learning in artificial and biological systems摘要:生物系统和人工系统的研究之间已经有了相互联系的硕果累累的概念和想法。在人工智能领域的强化学习方面的早期的研究工作和进展都源至于Bush and Mosteller 两人在生物学方面研究的启发。最近,时序差分的强化学习对于理解多巴胺神经元的活动提供了一个有力的框架。在本文的综述中,我们将描述生物系统和人工系统在强化学习方面的最新研究工作和进展。我们主要关注两个学科之间的一些.

2020-07-26 20:19:17 296

原创 扩展欧几里得算法(求最大公约数与逆)

#include class GCD{ public: long long a1,a2; long long Gcd; long long u,v; // Gcd=this->gcd(a1,a2); public: /*long gcd(long a1,long a2){ if(a2==

2017-03-07 21:28:18 721

原创 德州扑克七张牌的比较(21次搜索)

#include #include#include#include//#includeusing namespace std;struct card{ int num; char ch;};//每张牌用面值跟花色来描述。class Compare_5_cards{ public: bitset cards[5]; //

2017-03-07 21:24:11 2967

原创 动态规划之钢条分割

问题描述:p(n): p[1],p[2],.....,p[n]表示钢条长度为1,2,.....,n时的价格。给定length长度的钢条如何分割或者不分割整条卖才能得到最大收益。#include #include#includeusing namespace std;int top_to_bottom(int *price,int * max_value,int n){ if

2017-03-07 21:18:49 405

转载 文件流,clear()函数的应用

清除文件流的状态考虑这样的程序,它有一个 vector 对象,包含一些要打开并读取的文件名,程序要对每个文件中存储的单词做一些处理。假设该 vector 对象命名为files,程序也许会有如下循环:// for each file in the vectorwhile (it != files.end()) {ifstream input(it->c_str()); //

2017-02-13 22:47:02 10085

转载 流状态

流的状态由 bad、fail、eof 和 good 操作提示。如果 bad、fail 或者 eof中的任意一个为 true,则检查流本身将显示该流处于错误状态。类似地,如果这三个条件没有一个为 true,则 good 操作将返回 true。clear 和 setstate 操作用于改变条件成员的状态。clear 操作将条件重设为有效状态。在流的使用出现了问题并做出补救后,如果我们希

2017-02-13 22:11:36 816

转载 const 成员函数

const 成员函数的引入现在,可以理解跟在 Sales_item 成员函数声明的形参表后面的 const 所起的作用了:const 改变了隐含的 this 形参的类型。在调用total.same_isbn(trans) 时,隐含的 this 形参将是一个指向 total 对象的const Sales_Item* 类型的指针。就像如下编写 same_isbn 的函数体一样://

2017-02-13 22:05:07 379

转载 指向函数的指针

7.9. 指向函数的指针函数指针是指指向函数而非指向对象的指针。像其他指针一样,函数指针也指向某个特定的类型。函数类型由其返回类型以及形参表确定,而与函数名无关:// pf points to function returning bool that takes two const stringreferencesbool (*pf)(const string &, const

2017-02-13 22:00:29 356

转载 stringstream用法

1 std::string name("12345");2 int age = 27;3 stringstream os;4 os 5 os >> age;6 // age = 123457 cout 1 std::string name("12345");2 int age = 27;3 stringstream o

2017-02-13 21:54:29 310

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除