【AI炼丹术】写深度学习代码的一些心得体会

本文分享了深度学习代码编写的经验,提出了先准备数据集,再构建模型,最后编写训练代码的顺序。强调了模型结构与数据格式的匹配,数据读取和预处理的重要性,以及训练策略的构建。同时,指出应根据数据特性选择合适模型,并注重模型的调试和优化,不断迭代以提升模型性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

写深度学习代码的一些心得体会


一般情况下,拿到一批数据之后,首先会根据任务先用领域内经典的Model作为baseline跑通,然后再在这个框架内加入自己设计的Model,微调代码以及修改一些超参数即可。总体流程参考如下:

  1. 先写dataset部分,包括数据的读取、预处理、增广等操作,将数据集准备好。
  2. 然后model部分baseline无需修改,proposed是自行设计,定义模型的结构和参数,建立模型架构。
  3. 最后是train部分,这里调用所有的类实现训练:包括定义模型,模型包裹;获取dataloader;定义loss,优化器,学习率,定义early stoping策略;保存模型权重,保存日志。

当然,文无定法。这个顺序并不是固定不变的,也可以根据具体情况作出相应的调整。例如,当你的数据集已经准备好了,可以直接开始定义模型,然后再定义训练过程;或者在进行模型训练之前,先进行数据集的分析和可视化等操作。

体会1

源自:作者三四但不犹豫
对于图像任务:

  1. 顺序上,先写dataset部分,检查基本的transform,再搭model&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

镰刀韭菜

看在我不断努力的份上,支持我吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值