第三课学习笔记 深度学习模型训练和关键参数调优详解

本文介绍了深度学习模型的选择,包括回归任务、分类任务和场景任务,并通过实例讲解模型训练的基本原理和超参数优化。同时,强调了效果展示的重要性,如输入输出可视化和使用VisualDL工具。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、模型选择:从任务类型出发,选择最适合的模型
1、回归任务
从使用Numpy推导,到使用深度学习框架,一步步走进最简单的回归任务:当人工智能邂逅蓝桥杯算法题,会擦除怎样的火花?(链接:https://aistudio.baidu.com/aistudio/projectdetail/1693536?channelType=0&channel=0)

(1)实现原理

a.从最简单的神经网路开始

b.神经网络工作原理概述

c.使用多个输入进行预测

d.只用一个输入做出多个输出

e.基于多个输入得到多个输出

f.用预测结果进一步预测

(2)拟合斐波那契数列

a.问题描述:输入格式、输出格式

b.生成数据:输入数据、数据对应的标签、将数组转换成张量

c.构建线性回归模型

d.构建优化器和损失函数

e.模型训练

f.模型验证

(3)大等于n的最小完全平方数

a.问题描述:输入格式、输出格式

b.生成数据

c.构建线性回归模型

d.构建优化器和损失函数

e.模型训练

f.模型验证

小结:先用传统方法人脑解题,写出能算出结果的函数,然后根据这一函数生成训练数据,最后训练出线性回归模型。使用简单的线性变换层组建网络,使用少量数据进行拟合,模型输出能近似预期结果,但还有一定的差距,有很大的提升的空间,感兴趣的开发者可以基于本项目,尝试使用更多的数据、更复杂的网络等。

人脸关键点检测:基于空间注意力SAN与GoogLeNet实现人脸关键点检测并自动添加表情贴纸(链接:https://aistudio.baidu.com/aistudio/projectdetail/1533049?channelType=0&channel=0)。

2、分类任务
      CIFAR-10数据集也是分类任务中一个非常经典的数据集,在科研中,常常使用CIFAR数据集评估算法的性能。

图像分类:从论文到代码深入解析带有门控单元的gMLP算法。(链接:https://aistudio.baidu.com/aistudio/projectdetail/2134364)

3、场景任务
      这里说的场景任务是针对某一个特定的场景开发的深度学习任务,相比于回归和分类任务来说,场景任务的难度更高。这里说的场景任务包括但不限于目标检测、图像分割、文本生成、语音合成、强化学习等。

目标检测:基于PaddleX的YOLOv3模型快速实现昆虫检测(链接:https://aistudio.baidu.com/aistudio/projectdetail/442375)。

人像分割:基于PaddleX核心分割模型 Deeplabv3+Xcetion65 & HRNet_w18_small_v1 实现人像分割,PaddleX提供了人像分割的预训练模型,可直接使用,当然也可以根据自己的数据做微调(链接:https://paddlex.readthedocs.io/zh_CN/release-1.3/examples/human_segmentation.html)。

文字识别:基于chinese_ocr_db_crnn_mobile实现文字识别,识别图片当中的汉字,该Module是一个超轻量级中文OCR模型,支持直接预测(链接:https://www.paddlepaddle.org.cn/hubdetail?name=chinese_ocr_db_crnn_mobile&en_category=TextRecognition)。

二、模型训练
       仅基于原生Python和Numpy看模型训练基本原理:神经网络梯度下降原理详解(链接:https://aistudio.baidu.com/aistudio/projectdetail/757995)。

1. 基于高层API训练模型:通过Model.prepare接口来对训练进行提前的配置准备工作,包括设置模型优化器,Loss计算方法,精度计算方法等。

2. 使用PaddleX训练模型:YOLOv3模型的训练接口示例,函数内置了piecewise学习率衰减策略和momentum优化器。

三、超参优化
           1. 超参优化的基本概念

2. 手动调整超参数的四大方法:使用提前停止来确定训练的迭代次数,让学习率从高逐渐降低,宽泛策略,小批量数据(mini-batch)大小不必最优。

四、效果展示
           1. 可视化输入与输出:直接可视化输入与输出是最直接的方法。

2.巧用VisualDL:VisualDL文档:https://ai.baidu.com/ai-doc/AISTUDIO/Dk3e2vxg9#visualdl%E5%B7%A5%E5%85%B7

3.权重可视化:InterpretDL源码:https://github.com/PaddlePaddle/InterpretDL

总结:
           1、重要的是神经网络工作的基本原理,搞懂了原理,才能更好地进行超参优化,得到更好的模型效果。

2、学会使用SubClass形式组网,科研需要一定要学会用SubClass形式组网。

3、模型训练,超参数的选择有很多讲究,超参的好坏往往会影响模型的最终结果。

4、效果展示十分重要,是一个项目的加分项。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值