- 博客(2)
- 收藏
- 关注
原创 3层CNN训练mnist
损失函数:采用交叉熵损失,常用于多分类问题,用于衡量模型预测值与真实标签之间的差异。优化器:采用 Adam 优化器,结合动量和自适应学习率机制,根据每个参数的梯度的一阶矩(均值)和二阶矩(方差),动态调整学习率,提高收敛速度。训练代码中,先计算预测和标签之间的损失,在进行反向传播和更新参数。
2025-03-22 21:31:27
312
原创 CIFAR10训练ResNet18
由于CIFAR10数据集图片较小,尺寸为32*32,故将第一层的卷积核改为3*3,如果继续沿用7*7,导致特征图尺寸迅速变小,丢失很多空间信息。输入通道为3,输出通道为64,不进行下采样同样使用卷积+批归一化+激活函数的组合,不仅可以有效提取和转换特征,还能稳定训练过程和提升网络性能#在__init__方法中#在forward方法中。
2025-03-19 21:40:47
821
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人