PyTorch卷积核调整与模型训练分析

原创

于 2025-09-14 13:29:55 发布 · 684 阅读

26 ·

CC 4.0 BY-SA版权

文章标签：

#PyTorch # 卷积核 # 过拟合

1、选择一个数学运算，如余弦或平方根。你能在torch库中找到对应的函数吗？

以下是调整为 Markdown 格式的文本内容：

能，`torch` 库中有对应的数学运算函数，例如余弦运算对应的函数是 `torch.cos`，平方根运算对应的函数是 `torch.sqrt`。

2、切换损失函数（例如均方误差损失函数MSE），训练行为会改变吗？

训练行为实际上没有改变，使用 nn.MSELoss 替代手写的损失函数后，输入到训练循环中的其他内容保持不变，结果也和之前相同。如果结果不同，则意味着两种实现方式之一存在错误。

3、是否有可能将网络的容量降低到足以停止过拟合的程度？如果这样做，模型在验证集上的表现如何？

有可能通过降低网络容量来停止过拟合。当降低网络容量避免过拟合时，模型在验证集上的损失会随着训练集损失一起下降，能够更好地泛化到验证集样本，在新的、之前未见过的数据点上，损失函数的值会更好。

4、将我们的模型修改为使用 5 × 5 的卷积核，即在 nn.Conv2d 构造函数中传入 kernel_size=5。这一更改对模型的参数数量有什么影响？

使用卷积层时，参数数量不取决于图像中的像素数量，而是取决于卷积核的大小（如 5 × 5 ）以及模型中使用的卷积滤波器（或输出通道）的数量。

使用 5 × 5 的卷积核相比更小尺寸的卷积核（如 3 × 3 ），通常会增加模型的参数数量，因为更大的卷积核需要学习更多的权重参数。

5、将模型修改为使用 5 × 5 的卷积核，可通过在 nn.Conv2d 构造函数中传入 kernel_size=5 来实现。那么 kernel_size=(1,3) 在二维卷积中会起到什么作用？

在二维卷积中， kernel_size=(1,3) 表示卷积核的形状为 1 行 3 列。

卷积操作时，该卷积核会在输入图像上滑动，对每个局部区域进行卷积计算，以提取特定的特征。

与常见的方形卷积核（如 3×3、5×5）不同，这种非对称的卷积核可以捕捉到输入图像在水平方向上更宽范围的特征，而在垂直方向上只考虑 1 行的信息，更侧重于提取水平方向的特征模式。

6、Pick a project that sounds exciting to you. Kaggle is a great place to start looking. Dive in.

选一个让你感到兴奋的项目。Kaggle是一个很好的开始寻找的地方。大胆去尝试吧。

7、启动 Jupyter 笔记本服务器。a. Jupyter 使用的 Python 版本是多少？b. Jupyter 使用的 torch 库的位置与你从交互式提示符导入的 torch 库的位置是否相同？

对于a，可在 Jupyter 中使用代码查询 Python 版本；
对于b，可通过代码查看 torch 库位置并和交互式提示符导入的进行比较。

8、启动 Python 以获取交互式提示符。a. 你使用的 Python 版本是什么？我们希望至少是 3.6 版本！b. 你能导入 torch 吗？你得到的 PyTorch 版本是多少？c. torch.cuda.is_available() 的结果是什么？它是否与你基于所使用硬件的预期相符？

需用户在实际操作中启动 Python 交互式提示符后，通过相应命令查看：

a. 使用 `python --version` 查看 Python 版本；

b. 在 Python 交互式环境输入 `import torch` 尝试导入，若成功，使用 `torch.__version__` 查看 PyTorch 版本；

c. 在导入 torch 后，输入 `torch.cuda.is_available()` 查看结果，并根据自身硬件情况判断是否符合预期。