pytorch深度学习案例（一）——手写数学符号识别

原创已于 2023-02-18 10:27:14 修改 · 2.2k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #pytorch #神经网络

于 2023-01-28 10:30:22 首次发布

深度学习方法同时被 2 个专栏收录

23 篇文章

订阅专栏

pytorch深度学习基础

15 篇文章

订阅专栏

本文介绍了一种基于PyTorch的手写数学符号识别方法，使用了多种CNN模型，如LeNet、AlexNet等，在含有82类超过30万张图片的数据集上进行了训练与验证。

部署运行你感兴趣的模型镜像

文章目录

前言
简介
详细讲解

前言

在前面的两篇文章中我们介绍了现代计算机视觉中常见的结构化和非结构化的CNN模型，本篇我们将使用这些CNN模型在手写数学符号数据集上进行识别。
CNN模型的介绍请参照之前的两篇文章，源码放到最后。

pytorch深度学习基础（十）——常用线性CNN模型的结构与训练

pytorch深度学习基础（十一）——常用结构化CNN模型构建

简介

数据集

所用的数据集是来自kaggle的Handwritten math symbols dataset，其中包括超过30w张图片，共有82个类别。解压后的数据放到extracted_images中作为数据

数据集下载地址：
Handwritten math symbols dataset

项目结构

项目的组织形式如下
在这里插入图片描述

utils模块

utils中包括数据的加载，模型以及画图展示

dataLoader

idxPrepare
传入数据所在的路径，获取标签与索引的对应关系并以字典的形式保存，并返回由(图片，类别)组成的列表

image2txt
传入由(图片，类别)组成的列表，将数据集划分成训练数据和测试数据。并将路径以及对应的标签存放到txt文件中

MyLoader
使用torchvsion加载图片

MyDataLoader
由于数据量稍微有些大，直接使用torch的数据加载有可能会导致OOM，所以构建了一个数据加载的类，这个类并不会将所有的数据一次性全部加载到内存，而是将存有数据路径和对应的类别先全部加载到内存中，当需要用到数据时，再将数据从磁盘中读到内存当中。

LoadDataset
为了方便加载数据，构建了一个数据加载器，传入数据的路径，数据的批量大小和图片的大小，返回训练数据和测试数据的迭代器以供模型的训练

models

包含各种常见的CNN分类模型，包括LeNet、alexNet、vgg11、NiN、GoogLeNet、resNet18、denseNet模型的构建
select_model
用于选择模型，传入模型的名称以及模型的参数，返回选择的分类模型

plotShow

传入由训练损失、训练精度、测试损失、测试精度组成的字典，然后绘制出图像

train模块

用于训练模型
accuracy
传入预测结果和标签，用于评估预测精度
train
传入选择使用的模型，模型参数，训练数据、测试数据、训练轮次、学习率、训练设备、提前终止训练的阈值以及是否保存检查点，进行模型的训练，最终训练结果将会保存在model_weights文件夹中

predict模块

根据不同的参数设置可以进行预测，可选的预测模式有单张图片预测，从文件夹中预测以及随机选取测试集中的数据进行预测

下载地址

GitHub地址：Handwritten-math-symbols-recognition

详细讲解

手写数学符号识别项目（一）——数据集以及数据概况

手写数学符号识别项目（二）——数据加载以及模型浅试

手写数学符号识别项目（三）——模型训练与预测

您可能感兴趣的与本文相关的镜像

PyTorch 2.6

PyTorch 2.6

PyTorch

Cuda

PyTorch 是一个开源的 Python 机器学习库，基于 Torch 库，底层由 C++ 实现，应用于人工智能领域，如计算机视觉和自然语言处理

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

艾醒(AiXing-w) 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。