手撕Vision Transformer -- Day5 -- predict.py-优快云博客

本文链接：https://blog.youkuaiyun.com/m0_62030579/article/details/145415336

手撕Vision Transformer – Day5 – predict.py

Vit 网络结构图

在这里插入图片描述

Vit 网络结构

predict代码

Part1 库函数

# 该模块主要是为了预测分类，输入一个图像得到一个类别
'''
# Part1 引入相关的模型
'''
import torch
from dataset import Mnist_dataset
import matplotlib.pyplot as plt

Part2 初始化模型的一些参数

'''
# part2 下载模型
'''
net = torch.load('VIT_eopch_0.pt')
net.eval()
data_cs = Mnist_dataset(is_tran=False)

Part3 开始训练

'''
# Part3 开始测试
'''
if __name__ == '__main__':
    img, label = data_cs[1]
    label_predict = net(img.unsqueeze(0))
    label_predict = torch.argmax(label_predict)
    if label_predict == label:
        print('真实的标签为{},预测的标签为{}，预测正确'.format(label, label_predict))
    else:
        print('真实的标签为{},预测的标签为{}，预测错误'.format(label, label_predict))
    # 开始绘制图像
    plt.imshow(img.permute(2,1,0))
    plt.show()