Pytorch 串行训练两个网络

最新推荐文章于 2023-08-09 03:50:53 发布

原创最新推荐文章于 2023-08-09 03:50:53 发布 · 6.2k 阅读

27 ·

CC 4.0 BY-SA版权

Python 同时被 2 个专栏收录

13 篇文章

订阅专栏

paper

6 篇文章

订阅专栏

博客围绕Pytorch使用展开，介绍了将前一个网络输出作为后一个网络输入时的报错解决办法，即对前一个网络输出加'.data'；还提及多个Dataloader同时训练时使用cycle的注意事项，以及tensor转成numpy在不同情况（GPU/CPU的Variable和tensor变量）下的操作和相关函数作用。

RuntimeError: Trying to backward through the graph a second time, but the buffers have already been freed.

（一）我要完成的是，把前一个网络的输出作为后一个网络的输入。

pytorch生手……我一开始还以为是使用了两次loss.backward，需要在第一个处保存：loss.backward(retain_graph=True)，结果还是一直报这个错。

后来发现需要对前一个网络的输出加'.data'，也就是写成'output.data'，表示取出不带梯度的变量值（大概是这个意思(๑•̀ㅂ•́)و✧）。

（二）如果还需要多个Dataloader同时训练呢：

from itertools import cycle

for step, tupdata in enumerate(zip(cycle(loader1), loader2)):
    data1, labels1, data2, labels2 = tupdata[0][0], tupdata[0][1], tupdata[1][0], tupdata[1][1]

这样使用cycle时，将再次重复使用最小的数据集，注意取出的数据是tuple元组类型。

（三）将tensor转成numpy的几种情况

1. GPU中的Variable变量：

a.cuda().data.cpu().numpy()

2. GPU中的tensor变量：

a.cuda().cpu().numpy()

3. CPU中的Variable变量：

a.data.numpy()

4. CPU中的tensor变量：

a.numpy()

总结：

.cuda()是读取GPU中的数据

.data是读取Variable中的tensor

.cpu是把数据转移到cpu上

.numpy()把tensor变成numpy

6 条评论

amao_ 2022.03.21
你好，请问在第一个模型的输出加.data，那是不是最后更新参数的时候只能更新第二个模型的参数，第一个模型的参数不变

赵城武！ 2021.04.01
你好，请问如果我想把两个网络连起来，相当于一个pipeline。最后只有一个loss，还总是报这个错误 Trying to backward through the graph a second time, but the buffers have already been freed.
- Hikia回复赵城武！ 2021.06.08
  遇到了一样的问题，请问最后是怎么解决的呢
- べ云淡风轻べ回复赵城武！ 2021.05.24
  你好请问这个问题解决了吗

小坏蛋_千千 2020.12.02
咦，师姐打算把两段网络接起来，然后训练的时候中间一个 loss1，最后一个 loss2 么？如果是这样的话直接最后 loss = loss1 + loss2，loss.backward() 就可以啦。如果像师姐现在做的，直接把第一段网络的输出拿过来，且不要它的梯度，那相当于一个 pipeline 的结构，后一段网络的效果也取决于前面。
- kewlgrl回复小坏蛋_千千 2020.12.03
  我不是把两个网络连起来，我是协同训练，两个网络都需要完整的搞定