
Dialog
文章平均质量分 80
jinmingz
ASR SRE DeepLearning
展开
-
Q-learning 理解以及简单实现
强化学习(reinforcement learning)的过程,强化学习中有状态(state)、动作(action)、奖赏(reward)这三个要素。 智能体需要根据当前状态来采取动作,获得相应的奖赏之后,再去改进这些动作,使得下次再到相同状态时,智能体能做出更优的动作。下面以一个综合全面的例子来理解Q-learning的过程。 http://mnemstudio.org/path-f...转载 2018-05-12 21:48:45 · 19804 阅读 · 2 评论 -
seq2seq模型中最后的Loss该如何计算
#!coding=utf-8import numpy as npimport tensorflow as tffrom tensorflow.contrib.seq2seq import sequence_loss'''为了探究 seq2seq 中的loss具体改如何计算, 依据的标准是 tensorflow.contrib.seq2seq.sequence_loss'''# l...原创 2019-03-24 16:37:18 · 5795 阅读 · 0 评论