最近在做一些文本分类问题过程中,频繁使用Bilstm,对于tf.nn.bidirectional_dynamic_rnn()函数使用较多,笔者在之前介绍过tf.nn.dynamic_rnn()函数,在此基础上,参考https://blog.youkuaiyun.com/wuzqChom/article/details/75453327和https://blog.youkuaiyun.com/taolusi/article/details/81232210两篇博客,结合自身理解对tf.nn.bidirectional_dynamic_rnn()函数进行详细解释。
首先我们了解一下函数的参数
bidirectional_dynamic_rnn(
cell_fw, # 前向RNN
cell_bw, # 后向RNN
inputs, # 输入
sequence_length=None,# 输入序列的实际长度(可选,默认为输入序列的最大长度)
initial_state_fw=None, # 前向的初始化状态(可选)
initial_state_bw=None, # 后向的初始化状态(可选)
dtype=None, # 初始化和输出的数据类型(可选)
parallel_iterations=None,
swap_memory=False,
time_major=False,
scope=None)
值得注意的是,当inputs的张量形状为[batch_size,max_len,embeddings_num]时,time_major = False。当inputs的形状为[max_len,batch_size,embeddings_num]时,time_major = True。一般我们将输入的格式为[batch_size,max_len,embeddings_num],因此time_major的默认值为Fal