深度学习模型训练之炼丹心得

本文总结了深度学习模型训练中遇到的问题及其解决办法,包括数据集检查、数据预处理、模型炼丹和训练过程优化等方面。通过检查输入数据、使用随机输出、调整数据平衡和批大小、监控损失函数等手段,帮助开发者更好地理解和调试模型,提升模型性能。

最近炼丹,网络往往什么都学不到= =,不仅怀疑,看到一份英文的炼丹指南,记录一些心得。

英文链接:37 Reasons why your Neural Network is not working

紧急手段

  1. 使用已知适用于此类数据的简单模型(例如,VGG用于图像)。 如果可以,使用标准损失。

  2. 停掉所有的花里胡哨,例如 正则化和数据增强。

  3. 如果是微调模型,请仔细检查数据预处理,确保它与原始模型的训练格式相同。

  4. 验证输入数据是否正确。

  5. 从一个非常小的数据集开始(2-20个样本),在其上过拟合, 再在它上面逐渐添加更多数据。

  6. 开始逐步添加所有省略的部分:数据增强/正则化,自定义损失函数,尝试更复杂的模型。


数据集的问题

检查你的输入

确认你输入的数据符合情理,最好输出一个batch的tensor,确认你的输入是可靠的。

尝试随机输出

输入随机的数据,如果出现同样的错误,说明你的网络,将数据转换为垃圾数据,你需要一步步排查那一层出现了问题

数据加载

你的数据肯是好的,但是你将其传给输入的代码,可能是坏的,所以打印出第一层的输入来检查它

确认输入与groundtruth是对应的

如果只有一部分结果是对的,则有可能输入与真实值不对应。请确保输入与真图打乱之后是对应的。

输入输出是否有关系

输入得到输出的关系是否强烈,当然这和数据集有关系。

数据集是否有太多噪声

打乱数据集

按顺序的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值