14、PyTorch教程---数据集

Knowledgebase

于 2023-09-26 15:27:22 发布

阅读量161

点赞数

CC 4.0 BY-SA版权

分类专栏： PyTorch保姆级教程文章标签：算法人工智能 pytorch 深度学习机器学习

本文链接：https://blog.youkuaiyun.com/Knowledgebase/article/details/133311433

PyTorch保姆级教程专栏收录该内容

21 篇文章 ¥19.90 ¥99.00

订阅专栏

本章详细介绍了PyTorch中的torchvision.datasets模块，包括MNIST和COCO数据集的使用。MNIST数据集提供了训练和测试集，支持下载。COCO数据集则需要COCO API，可用于图像识别和处理。数据集主要功能有Transform和Target_transform，分别用于图像和目标的转换。示例代码展示了如何加载和使用这两个数据集。

在本章中，我们将更加专注于torchvision.datasets及其各种类型。PyTorch包括以下数据集加载器：

MNIST
COCO（字幕和检测）
数据集包括以下两种类型的主要功能：

Transform - 一个接受图像并返回标准内容的修改版本的函数。这些可以与transforms组合在一起。

Target_transform - 一个接受目标并对其进行变换的函数。例如，接受字幕字符串并返回世界索引的张量。

MNIST
以下是MNIST数据集的示例代码：

dset.MNIST(root, train=True, transform=None, target_transform=None, download=False)

参数如下：

root - 数据集的根目录，其中包含已处理的数据。

train - True表示训练集，False表示测试集。

download - True表示从互联网下载数据集并将其放入根目录。

COCO
这需要安装COCO API。以下示例用于演示使用PyTorch实现的COCO数据集：

import torchvision.datasets as dset
import torchvision.transforms as transforms

cap = dset.CocoCaptions(root='图像所在目录', annFile='json注释文件', transform=trans

了解本专栏