疑似肿瘤分类模型的训练与设计
1 预训练设置与初始化
在选择优化器时,随机梯度下降(SGD)通常是一个安全的起点。虽然有些问题可能不太适合使用 SGD,但这种情况相对较少。同样,学习率设为 0.001 和动量设为 0.9 也是比较安全的选择。从经验来看,使用这些值的 SGD 在很多项目中都表现不错,如果一开始效果不好,也很容易尝试 0.01 或 0.0001 等其他学习率。
不过,这些值不一定是最适合我们的用例的。系统地尝试不同的学习率、动量、网络大小和其他类似的配置设置,这被称为超参数搜索。在后续的工作中,我们需要先解决一些更明显的问题,之后再对这些值进行微调。除了 SGD,还有其他更复杂的优化器可供选择,但在本文中,除了可能将 torch.optim.SGD 替换为 torch.optim.Adam 外,理解这些选择的权衡涉及的内容过于高级。
2 数据加载器的使用
2.1 数据转换
之前构建的 LunaDataset 类,是连接原始数据和 PyTorch 所需张量数据的桥梁。例如, torch.nn.Conv3d 需要五维输入:(N, C, D, H, W),分别表示样本数量、每个样本的通道数、深度、高度和宽度,这与 CT 提供的原生 3D 数据不同。
在 LunaDataset.__getitem__ 中, ct_t.unsqueeze(0) 调用为数据提供了第四维,即“通道”。RGB 图像有三个通道,分别对应红、绿、蓝;而 CT
超级会员免费看
订阅专栏 解锁全文
36

被折叠的 条评论
为什么被折叠?



