Tensorflow - dynamic_rnn 学习

最新推荐文章于 2020-10-30 15:09:00 发布

原创最新推荐文章于 2020-10-30 15:09:00 发布 · 259 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#Tensorflow

Tensorflow 总结专栏收录该内容

11 篇文章

订阅专栏

本文详细介绍了如何使用TensorFlow构建RNN网络，包括LSTM与GRU单元的定义，以及如何通过dynamic_rnn函数搭建多层网络。特别强调了避免维度错误的技巧，适合深度学习初学者及实践者参考。

部署运行你感兴趣的模型镜像

函数目的就是为了构建一个RNN网络，前面少不了定义cell的类型，如LSTM与GRU等

API 里面 dynamic_rnn 函数的参数如下：

tf.nn.dynamic_rnn(
    cell,
    inputs,
    sequence_length=None,
    initial_state=None,
    dtype=None,
    parallel_iterations=None,
    swap_memory=False,
    time_major=False,
    scope=None
)

例子：

# create a BasicRNNCell
rnn_cell = tf.nn.rnn_cell.BasicRNNCell(hidden_size)

# 'outputs' is a tensor of shape [batch_size, max_time, cell_state_size]

# defining initial state
initial_state = rnn_cell.zero_state(batch_size, dtype=tf.float32)

# 'state' is a tensor of shape [batch_size, cell_state_size]
outputs, state = tf.nn.dynamic_rnn(rnn_cell, input_data,
                                   initial_state=initial_state,
                                   dtype=tf.float32)

多层网络：

这个定义的方法值得学习一个，因为这样定义可以避免维度错误，主要原因是TensorFlow的版本问题，可以构建一个多层网络，而且embedding size 和 hidden size的维度可以不同。

# create 2 LSTMCells
rnn_layers = [tf.nn.rnn_cell.LSTMCell(size) for size in [128, 256]]

# create a RNN cell composed sequentially of a number of RNNCells
multi_rnn_cell = tf.nn.rnn_cell.MultiRNNCell(rnn_layers)

# 'outputs' is a tensor of shape [batch_size, max_time, 256]
# 'state' is a N-tuple where N is the number of LSTMCells containing a
# tf.contrib.rnn.LSTMStateTuple for each cell
outputs, state = tf.nn.dynamic_rnn(cell=multi_rnn_cell,
                                   inputs=data,
                                   dtype=tf.float32)