《深度学习网络训练--第一讲》数据采集与数据预处理

本文探讨了在人脸数据采集过程中遇到的问题及解决方案。详细介绍了为满足深度学习算法的需求,如何通过扩大数据集规模和使用数据增强技术来提高数据的质量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

经过项目的实践,我感受到要想训练出一个性能优良的模型网络,数据采集与预处理是多么的艰难与重要。

  • 数据的采集

数据的采集是一个费时费力的过程。对于人脸数据来说,针对产品的应用场景,需要采集不同环境变量的人脸图像。对于我的经验来说,公司想要做一个人脸识别的AI产品,采集人脸的时候,往往采用发动全公司员工积极配合采集人脸,但是这样的人脸数据往往多样性比较差,也就是说人头个数没有多少,但是一个人可以采集多张不同角度和不同光照条件下的人脸图像。如果采用深度学习的方法来做,这样的数据集往往是不合格的,多样性不够,人脸图片数量也不够多。为了能够应用深度学习算法,可以有两种方法扩充数据集:
1) 掺入公开数据集
2) 数据增强。也就是对每一张人脸图片进行旋转,白化等操作。

.

  • 训练之前的数据预处理
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值