网络训练积累 -- 如何跑通第一个模型

讲得很好,记下来以后可以借鉴:

如何跑通第一个模型

面对一个全新的任务时,可能会遇到深度神经网络的训练不收敛的情况:loss不下降或者计算过程中浮点数越界,处理这种情况有一些常见的技巧。总体的思路是尽量简化训练,使得网络参数很容易学,即使性能不够优,切忌在跑通第一个模型前就做很多为性能优化服务的、增加训练难度的事项,例如数据增强、网络加宽加深等

模型参数选择

  • 尽量找一个已经跑通过的、与当前任务相似的任务,借鉴其模型、超参数。任务相似主要包括:数据规模、训练目标(代价函数)、视觉任务的难度上相近。
  • 优先使用复杂度较低的网络,一方面可以排除参数太多学不动的问题(Res-Net在这方面有很大优势,几乎不会学不动),一方面可以加快实验迭代效率。
  • 用其他任务学好的模型参数做初始化,可以大大加速收敛,即使任务不同也没关系。
  • 先调低learning rate,可以等模型收敛后再把learning rate调高。

数据集

  • 减小训练集,先在训练集上测试,让模型overfit训练集。
  • 确认数据做了random shuffle(特别注意:caffe DataLayer的shuffle是不充分的)。
  • 确认数据做了归一化(在使用BN的情况下这一点不太重要),像素的灰度值较大(0-255),容易造成模型参数振荡并越界。

输出调试信息

  • 在训练流程中显示输入数据,包括图片和label,这是最容易出错的地方。
  • 查看每一层模型权重、每一层的输出是否合理,一般的DL工具会提供绝对值均值、方差。
  • loss层输出一些细化的统计量,例如在分类、检测中,输出每个类别的数据量、平均score等。
深度学习模型,你可以按照如下步骤进行操作: 1. 首先,搭建深度学习环境。你可以参考引用中提到的B站视频教程,其中讲解了如何从零开始搭建深度学习环境,并以Pix2PixGAN为例进行了实践演示。该视频提供了傻瓜式的手把手教程,对于初学者来说非常友好。 2. 确保你已经获取了深度学习模型的代码和数据。引用中提到的基于深度学习的故障诊断模型代码和数据可以作为一个参考。这个模型提供了数据和源码,并且已经经过验证,可以直接过查看源码中的全面注释,你可以更好地理解代码的功能和实现细节。 3. 理解模型的输入和输出。在运行深度学习模型之前,你需要明确输入数据的格式和预期的输出结果。这取决于你要解决的任务和具体的模型架构。可以参考模型代码中的注释和说明来了解这些信息。 4. 运行模型过设置好环境变量、安装必要的依赖库和模型所需的特定软件包,你可以开始运行深度学习模型了。根据你所使用的深度学习框架(如TensorFlow、PyTorch等),可以按照相应的文档和教程进行操作。 5. 调优和优化。一旦你成功地运行了深度学习模型,你可能会发现一些性能方面的问题。你可以尝试调整模型的超参数、优化算法或使用其他技术来提高模型的准确性和效率。 总结来说,要深度学习模型,你需要搭建深度学习环境、获取代码和数据,理解模型的输入和输出,运行模型,并进行调优和优化。以上步骤是一个一般的指导,具体的操作取决于你的具体需求和所使用的深度学习框架。希望对你有所帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值