深度学习之数据扩增

最新推荐文章于 2025-09-25 00:28:38 发布

原创最新推荐文章于 2025-09-25 00:28:38 发布 · 2.9k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

笔记专栏收录该内容

32 篇文章

订阅专栏

本文介绍了深度学习中数据扩增的重要性和常见方法，通过图像颜色、尺寸、形态、空间和像素变换，如torchvision库的RandomCrop和RandomHorizontalFlip等，以及imgaug和albumentations等第三方库，来增加训练样本数量，缓解模型过拟合，提升模型泛化能力。

一、数据扩增简介
在深度学习中数据扩增非常重要，可以增加训练样本数量，同时可以在一定程度上缓解模型过拟合，提高模型的泛化能力，可以扩展样本空间。
二、常⻅的数据扩增⽅方法
常见的数据扩增方法主要是从图像颜色，尺寸，形态，空间和像素角度进行变换。不同的数据扩增方法可以自由组合，得到更加丰富的数据扩增方法。以torchvision为例，常用的数据扩增方法包括：

transforms.CenterCrop 对图片中心进行裁剪
transforms.ColorJitter 对图像颜色的对比度，饱和度和零度进行变换
transforms.FiveCrop 对图像四个角和中心进行裁剪得到5份图像
transforms.Grayscale 对图像进行灰度变换
transforms.Pad 使用固定值进行像素填充
transforms.RandomAffine 随机放射变换
transforms.RandomCrop 随机区域裁剪
transforms.RandomHorizontalFlip 随机水平翻转
transforms.RandomRotation 随机旋转
transforms.RandomVerticaIFlip随机垂直翻转
三、常用数据扩增库
1.torchvision
https://github.com/pytorch/vision
pytorch官方提供的数据扩增库，提供了基本的数据扩增方法，可无缝与torch进行集成，数据扩增方法种类较少，速度中等。
2.imgaug
https://github.com/aleju/imgaug
imgaug常用第三方数据扩增库，提供多样数据扩增方法，组合起来方便，速度较快。
3.albumentations
https://albumentations.readthedocs.io
常用第三方数据扩增库，提供多样数据扩增方法，对图像分类、语意分割、物体检测、关键点检测都支持，速度较快。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。