tensor.detach() :
- 返回一个新的 从当前图中分离的 Variable。
- 返回的 Variable 永远不会需要梯度
- 如果 被 detach 的Variable volatile=True, 那么 detach 出来的 volatile 也为 True
- 还有一个注意事项,即:返回的 Variable 和 被 detach 的Variable 指向同一个 tensor
torch.cat([tensors], dim=0) : 按照dim叠加
torch.stack([tensors], dim=0): 堆叠并且给一个新的维度
tensor.permute(int[,int]): 转换维度,里面是新的维度顺序
tensor.contiguous() : 保证内存连续,一般permute之后用