如何使用pytorch下载MNIST数据集

代码如下:

# 1.定义超参数
BATCH_SIZE = 16

# 2.构建pipeline,对图片做一些变换
pipeline = transforms.Compose([
    transforms.ToTensor(),     
    transforms.Normalize((0.1307,),(0.3081,)) 
])

# 3.加载数据集
from torch.utils.data import DataLoader

# 下载数据集
train_set = datasets.MNIST("data",train=True,download=True,transform=pipeline)

test_set = datasets.MNIST("data",train=False,download=True,transform=pipeline)

# 加载数据
train_loader = DataLoader(train_set,batch_size=BATCH_SIZE,shuffle=True)
test_loader = DataLoader(test_set,batch_size=BATCH_SIZE,shuffle=True)

这样就会自动下载数据集,下载的数据集是在你的代码所在的文件夹下面,一个叫data的文件夹,那里面就是下载的图片。在这里插入图片描述
以上来源于从B站优秀的up主所讲解的视频中整理,B站链接为:
https://www.bilibili.com/video/BV1WT4y177SA?t=416

PyTorch下载MNIST手写数字数据集通常涉及使用`torchvision`模块,这是一个方便的数据加载工具包,它包含了各种常用的图像数据集,包括MNIST。以下是下载并预处理MNIST数据集的步骤: 1. **安装 torchvision**: 首先,确保已经安装了PyTorch。如果没有,可以使用pip安装: ```bash pip install torch torchvision ``` 2. **导入所需库并下载数据**: 导入`torchvision.datasets`和`torch.utils.data.DataLoader`等必要的模块,并加载MNIST数据集: ```python import torch from torchvision import datasets, transforms # 数据转换 transform = transforms.Compose([ transforms.ToTensor(), # 将像素值转化为0-1范围 transforms.Normalize((0.5,), (0.5,)) # 归一化到均值=0.5,标准差=0.5 ]) # 加载训练集和测试集 train_dataset = datasets.MNIST(root='./data', train=True, download=True, transform=transform) test_dataset = datasets.MNIST(root='./data', train=False, download=True, transform=transform) ``` 这里 `root='./data'` 表示数据将保存在当前目录下的 'data' 文件夹中。如果文件夹不存在,会自动下载。 3. **创建数据加载器**: 使用`DataLoader`函数创建迭代器,以便在训练过程中批处理数据: ```python batch_size = 64 train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True) test_loader = torch.utils.data.DataLoader(test_dataset, batch_size=batch_size, shuffle=False) ``` 现在,你可以使用`train_loader`和`test_loader`来访问训练集和测试集的样本及其对应的标签。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值