3d目标检测 | 模型基础概念

文章介绍了深度学习入门时需要注意的五个关键问题,包括理解数据集、模型输入和预测值、损失函数的标签获取以及推理时的解码需求。此外,讨论了Pipeline在深度学习中的应用,数据增强的方法及其对泛化能力的影响,以及如何应对正负样本不均衡的问题,强调了这些问题在模型训练中的重要性。

模型入门需要关注的五大问题

1. 数据集是什么?(都自带哪些信息)

2. 模型的输入具体是什么?(使用数据集的哪一部分作为输入)

3. 模型预测哪些值?

4. loss计算时,标签值是否可以直接获取?

5. 评估/推理时,网络预测值是否需要decode?

1. Pipeline

什么是Pipeline?

pipeline,即操作流水线,也称综合解决方案。

Pipeline是由很多组件步骤链接起来的“一条龙服务”方案。

一个基础的深度学习的Pipeline 主要包含了下述 5 个步骤:

  1. 数据读取
  2. 数据预处理 
  3. 创建模型(具体到模型也有相应的Pipeline,比如模型的具体构成部分:比如                                  GCN+Attention+MLP的混合模型)
  4. 评估模型结果
  5. 模型调参

2. 数据增强

什么是数据增强?

数据增强也叫数据扩增,意思是在不实质性的增加数据的情况下,让有限的数据产生等价于更多数据的价值。

数据增强的作用?

数据增强的本质是为了增强模型的泛化能力、 避免过拟合

数据增强有哪些常见方法?

2.1. 单样本数据增强

所谓单样本数据增强,即增强一个样本的时候,全部围绕着该样本本身进行操作,包括几何变换类,颜色变换类等。

(1) 几何变换类:翻转,旋转,裁剪,变形,缩放等

(2) 颜色变换类:噪声、模糊、颜色变换、擦除、填充等

2.2. 多样本数据增强

不同于单样本数据增强,多样本数据增强方法利用多个样本来产生新的样本,例如GAN,生成新的样本数据。

3. 正负样本不均衡问题

什么是正负样本?

正样本是指属于某目标类别的样本,负样本是指不属于目标类别的样本

正负样本不均衡会带来什么问题?

        主要是对分类的影响,在分类模型中,模型更偏向对多数类的预测概率,从而导致少数类的预测精度大幅度下降,虽然整体来看精度很好,但这与实际工作不符。

        例如在一张图中,正样本数量为1-10,而负样本数量为100-1000,则这么多的负样本不仅对训练网络起不到什么作用,反而会淹没掉少量但有助于训练的样本。

解决办法?

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值