循环神经网络系列(一)Tensorflow中BasicRNNCell

本文介绍了在Tensorflow中实现BasicRNNCell时遇到的理解难点,详细解释了RNN计算公式中各参数的含义,并通过源码分析确定了参数维度。通过计算验证了推断的正确性,帮助初学者理解RNN单元的实现。

按道理看完RNN的原理之后,我们就应该来用某种框架来实现了。可偏偏在RNN的实现上,对于一个初学者来说Tensorflow的表达总是显得那么生涩难懂,比起CNN那确实是差了一点。比如里面的参数就显示不是那么的友好。num_units到底指啥?原谅我最开始以为指的是RNN单元的个数。zero_state()中的参数为啥要指定batch_size?

1.结论

先回忆一下RNN的计算公式:
output=new_state=tanh⁡(input∗W+state∗U+B) output = new\_state = \tanh(input*W + state*U + B) output=new_state=tanh(inputW+stateU+B)

output_size = 10
batch_size = 32
cell = tf.nn.rnn_cell.BasicRNNCell(num_units=output_size)
input = tf.placeholder(dtype=tf.float32,shape=[batch_size,150])
h0 = cell.zero_state(batch_size=batch_size,dtype=tf.float32)
output,h1 = cell.call(input,h0)

上面是一个RNN单元最简单的定义形式,可是每个参数又到底是什么含义呢?我们知道一个最基本的RNN单元中有三个可训练的参数W,U,BW,U,BW,U,B,以及两个输入变量。所以我们在构造RNN的时候就需要指定各个参数的维度了。可上面6行代码中,各个参数又是谁跟谁呢? 下图就是直接结果。
在这里插入图片描述
注,上图中的n表示的是输入的维度dim

结合着上图和代码,可以发现:
第一:第3行代码的num_units=output_size就告诉我们,最终输出的类别数是output_size(例如:10个数字的可能性;),以及参数WW

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值