今天终于搞清楚了这个pack操作,链接可见https://zhuanlan.zhihu.com/p/34418001
packed = nn.utils.rnn.pack_padded_sequence(embedded, input_lengths)
# Forward pass through GRU
outputs, hidden = self.gru(packed, hidden)
# Unpack padding
outputs, _ = nn.utils.rnn.pad_packed_sequence(outputs)
但是还有一个问题,就是GRU如何识别pack操作后的数据:那么这里是有一个多态的判断——即调用gru网络函数,其内部有判断的代码。在pytorch的doc中有源码。如下:
def forward(self, input, hx=None):
if isinstance(input, PackedSequence):
return self.forward_packed(input, hx)
else:
return self.forward_tensor(input, hx)
接下来的forward_packed()函数和forward_tensor()函数有不同计算方式,这里给出两者对比
def forward_packed(self, input, hx=None):
# type: (Tuple[Tensor, Tensor, Optional[Tensor], Optional[Tensor]], Opti