MXNet的mxnet.gluon.data.vision的数据集和mxnet.gluon.data.vision.transforms的变换方法

本文介绍了MXnet官网提供的多种图像数据集资源,包括MNIST手写数字、时尚产品图片、CIFAR10及CIFAR100等,并详细列举了vision.transforms模块中的图像预处理方法,如数据增强、裁剪、缩放和颜色抖动等功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数据来源:

一、MXnet官网 vision.datasets

1、MNIST handwritten digits dataset from http://yann.lecun.com/exdb/mnist
2、A dataset of Zalando’s article images consisting of fashion products,
3、CIFAR10 image classification dataset from https://www.cs.toronto.edu/~kriz/cifar.html
4、CIFAR100 image classification dataset from https://www.cs.toronto.edu/~kriz/cifar.html
5、A dataset wrapping over a RecordIO file containing images.
6、A dataset for loading image files stored in a folder structure.

二、MXnet官网 vision.transforms

1、transforms.Compose 顺序组成多个变换
2、transforms.Cast 将输入转换为特定的数据类型
3、transforms.ToTensor 将图像NDArray或一批图像NDArray转换为张量NDArray
4、transforms.Normalize 用均值和标准差归一化形状为(C xH x W)或(N x C xH x W)的张量
5、transforms.RandomResizedCrop 使用随机比例和宽高比裁剪输入图像
6、transforms.CenterCrop 通过修整所有四个侧面并保留图像的中心,将图像src裁剪为给定的大小
7、transforms.Resize 将一个图像或一批图像NDArray调整为给定大小
8、transforms.RandomFlipLeftRight 从左到右随机翻转输入图像的概率为0.5
9、transforms.RandomFlipTopBottom 将输入图像从上到下随机翻转为0.5
10、transforms.RandomBrightness 随机抖动图像亮度,其因子为[max(0,1-亮度),1 +亮度]
11、transforms.RandomContrast 随机抖动图像对比度,其因子为[max(0,1-对比度),1 +对比度]
12、transforms.RandomSaturation 随机抖动图像饱和度,其因子选自[max(0,1-饱和度),1 +饱和度]
13、transforms.RandomHue 以[max(0,1-hue),1 + hue]中选择的因子随机抖动图像色调
14、transforms.RandomColorJitter 随机抖动图像的亮度,对比度,饱和度和色调
15、transforms.RandomLighting 将AlexNet样式的基于PCA的噪声添加到图像

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

irober

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值