PyTorch使用笔记

最新推荐文章于 2025-07-14 11:24:10 发布

原创最新推荐文章于 2025-07-14 11:24:10 发布 · 362 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#PyTorch

算法同时被 2 个专栏收录

20 篇文章

订阅专栏

细节

6 篇文章

订阅专栏

本文介绍如何将神经网络模型放置于GPU上以加速训练过程，使用PyTorch的nn.Sequential构造多层感知器（MLP），并在每个epoch后利用验证集评估模型，以防止过拟合并选择最佳模型。

将data, target, loss层，神经网络模型放到GPU上！
在构造模型时，可以使用这种方法，直接使用nn.Sequential来构造！
这样在forward时可以直接用一个self.model来做！

class MLP(nn.Module):

    def __init__(self):
        super(MLP, self).__init__()

        self.model = nn.Sequential(
            nn.Linear(784, 200),
            nn.ReLU(inplace=True),
            nn.Linear(200, 200),
            nn.ReLU(inplace=True),
            nn.Linear(200, 10),
            nn.ReLU(inplace=True),
        )

    def forward(self, x):
        x = self.model(x)

        return x

神经网络在训练时可以每经过一个epoch就用训练得到的模型在validation set上进行一下测试，看模型实际效果，从而有效避免过拟合的出现！
训练时可以每个epoch（或者每隔n个）学习到的模型以及其loss保存下来，然后用val set验证其准确率，最后所有的epoch完成后，从中选择一个效果最好的check point模型进行加载，对test set进行测试看其实际泛化能力，但一定注意test set的数据不参与backward，只是forward