学习记录总结专栏:机器学习:PyTorch框架-个人学习总结(专栏)
https://blog.youkuaiyun.com/spiderb/category_12838886.html
1 前言
在寻找示例之后,开始理解代码和运行实现之前,别忘了实现模型的一般的5个步骤:

本次,使用深度学习最常用的数据集:Mnist数据集.
MNIST是一个手写数字图像数据集,包含了大量的手写数字图片及其对应的标签,被广泛应用于图像分类和机器学习领域。 MNIST数据集由美国中学生手写数字组成,训练集包含6万张图片,测试集包含1万张图片,数字已经进行过预处理和格式化,图片尺寸固定为28×28。
Mnist数据集的下载地址: http://yann.lecun.com/exdb/mnist/
在下载后,通过 pickle.load加载对应的数据集后,可以打印出来数据图片:
from matplotlib import pyplot
import numpy as np
pyplot.imshow(x_train[0].reshape((28, 28)), cmap="gray")
print(x_train.shape)

当然,加载方式我们也可以选择pytorch内置的函数进行:
# 下载数据集
from torchvision import datasets, transforms
train_set = datasets.MNIST("data",train=True,download=True, transform=transforms.ToTensor(),)
test_set = datasets.MNIST("data",train=False,download=True, transform=transforms.ToTensor(),)
# datasets.MNIST:是Pytorch的内置函数torchvision.datasets.MNIST,可以导入数据集
# train=True :读入的数据作为训练集
# transform:读入我们自己定义的数据预处理操作
# download=True:当我们的根目录(root)下没有数据集时,便自动下载
2 数据处理
如果是采用pickle.load加载数据,那么我们需要使用map对数据进行数据类型转化,转化为pytorch框架的tensor数据类型。
x_train, y_train, x_valid, y_valid = map(
torch.tensor, (x_train, y_train, x_valid, y_valid)
)
# 如果是内置的方式,我们还可以自定义一个预处理:将两个步骤整合在一起
train_set = datasets.MNIST("data",train=True,download=True, transform=transforms.ToTensor(),)
test_set = datasets.MNIST("data",train=False,download=True, transform

最低0.47元/天 解锁文章
8186

被折叠的 条评论
为什么被折叠?



