ImageNet数据集准备方法

本文介绍了如何使用教育邮箱注册ImageNet官网并下载2012年的ISLVRC2012数据集,包括训练集和验证集的下载链接。下载后,将压缩包解压并移动到同一文件夹下进行后续处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  1. 登录imagenet官网用教育邮箱注册后,点击下载原始图片,选择2012下载ISLVRC2012
    http://www.image-net.org/challenges/LSVRC/2012/downloads

图片
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_train.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_val.tar
http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar(三个任务的test图片都在一个压缩包里)

  1. 下载training images 和 validation images 获得两个压缩包,放在同一个文件夹下,直接在该文件夹目录下执行下面的指令

  2. 解压训练集

mkdir train && mv ILSVRC2012_img_train.tar train/ && cd train
tar -xvf ILSVRC2012_img_train.tar && rm -f ILSVRC2012_img_train.tar
find . -name "*.tar" | while read NAME ; do mkdir -p "${NAME%.tar}"; tar -xvf "${NAME}" -C "${NAME%.tar}"; rm -f "${NAME}"; done
cd ..
  1. 解压验证集并移动至子文件夹

                
### 使用PyTorch下载和加载ImageNet数据集 对于希望利用PyTorch框架开展基于ImageNet数据集的研究或开发工作的用户而言,直接从官方渠道获取完整的ImageNet数据集是一个重要步骤。然而,需要注意的是,PyTorch本身并不提供内置接口来自动下载整个ImageNet数据集[^2]。 #### 获取ImageNet数据集 为了获得ImageNet数据集,建议访问官方网站并遵循其指引完成注册流程以获取下载权限。该过程可能涉及填写申请表单以及同意使用条款等内容。一旦获得了合法使用权,则可以根据个人需求选择不同版本的数据子集(例如大小调整后的图像尺寸如32x32像素等)进行下载[^4]。 #### 加载ImageNet数据集到PyTorch项目中 当本地已有准备好的ImageNet文件夹结构后,可以采用`datasets.ImageFolder`类轻松实现数据读取功能。此工具允许开发者仅需指定根目录路径即可快速构建训练集与验证集实例对象,并支持多种预处理操作配置选项,从而极大地简化了前期准备工作量[^1]。 ```python from torchvision import datasets, transforms import torch.utils.data as data transform = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), ]) train_dataset = datasets.ImageFolder(root='path_to_train_data', transform=transform) val_dataset = datasets.ImageFolder(root='path_to_val_data', transform=transform) train_loader = data.DataLoader(train_dataset, batch_size=64, shuffle=True) val_loader = data.DataLoader(val_dataset, batch_size=64, shuffle=False) ``` 上述代码片段展示了如何设置转换函数链路(resize、center crop 和 tensor conversion),并通过指明各自对应的磁盘位置创建两个Dataset对象——分别对应于训练阶段使用的样本集合及其标签信息;最后借助DataLoader封装成批次形式供后续模型迭代调用[^3]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值