pytorch验证码识别crnn+ctcloss+beam_search_decoder从0到1（附避坑要点！）

原创

已于 2022-08-01 13:48:00 修改 · 1.6k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#pytorch #人工智能 #python #rnn #cnn

于 2022-07-19 17:51:43 首次发布

本文介绍了使用PyTorch进行验证码识别的完整过程，包括数据处理、模型构建、CTC Loss函数的应用及训练细节。通过自定义Dataset加载数据，利用RNN和CNN网络结构，配合nn.CTCLoss进行训练。文中强调了标签编码的注意事项，如保持字符顺序一致，并确保空白字符在第一位。此外，还提到了训练后的模型泛化能力问题，由于数据量小，模型可能无法很好地泛化到新验证码。最后，作者分享了项目代码并推荐了fast_ctc_loss库作为替代方案。

数据说明：

网络上分享到的验证码数据，只有1040张图片。

制作dataloader

import os

import cv2 as cv
import torch
from torch.utils.data import Dataset

class CodeDataset(Dataset):

    def __init__(self, path='', transform=None):#, transform=None
        self.path = path
        self.transform = transform
        self.imgs = []
        for root, dirs, files in os.walk(path):
            for file in files:
                self.imgs.append(file)

        self.n_samples = self.imgs.__len__()
        self.labels = [i.split('.')[0] for i in self.imgs]
        unique_set=set(char for label in self.labels for char in label)
        self.map=sorted(list(unique_set))
        self.characters = ['-']+sorted(list(unique_set))
        self.myclass_len=len(self.characters)
        self.char_to_num = dict((c, i) for i, c in enumerate(se

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

VFAing

关注关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Pytorch利用CNN识别计算题验证码

码王吴彦祖的博客

03-31

3147

其实识别计算题验证码和识四六位定长验证码原理是一样的，利用深度学习识别的话方法有很多，可以利用RNN，可以利用目标检测，但是这里我就拿最简单的CNN来举例，这种简单的方式希望能引导大家，去实现更多的方式，先来看下数据集准备数据集，我的数据集是这样的，数据集总数有300多张，但是有200多张是重复的，真正能提供特征的话只有100多张，不过需要识别的只需要前三位就够了，数据集的分布分别为， 1-9的数字，3位运算符（没有除法），1-9的数字，即使全部排列组合，也没有多少数据集，当然，我没有采样到全部的数据

使用pytorch实现crnn

wzw12315的专栏

06-09

8041

改动点：（1）把传统的卷积改造成深度可分离卷积；（2）使用pytorch实现的ctc，不再使用百度开源的warpctc，主要原因是本人使用Windows来开发调试，编译warpctc貌似很麻烦； crnn网络实现代码： class BidirectionalLSTM(nn.Module): def __init__(self, nInput_size, nHidden,nOut): super(BidirectionalLSTM, self).__init__(.

参与评论您还未登录，请先登录后发表或查看评论

pytorch 0.4版本 crnn算法.

11-22

pytorch 0.4版本 crnn算法.github作者更新到了pytorch1.1版本，但是感觉效果没有老版的好。这是老版的代码.

用pytorch实现crnn+ctc来识别验证码

06-24

5773

pytorch 实现crnn+ctc来识别验证码说明环境搭建训练服务搭建说明利用crnn和ctc来进行验证码识别是现在主流的机器学习的方式，本文期望利用pytorch来实现单个验证码的识别，同时整合多个训练样本，期望能通过增量识别的方式，最终通过一个模型来识别多个验证码。本文采用的是阿里云的gpu的服务器。源码地址:https://github.com/linlihuiyang/ocr-p...

Pytorch使用CRNN CTCLoss实现OCR系统

fanhenghui的专栏

10-22

5075

卷积递归神经网络此项目使用CNN + RNN + CTCLoss实现OCR系统，灵感来自CRNN网络。一、用法 python ./train.py --help 二、演示 1、使用TestDataset数据生成器训练简单的OCR。训练60-100次。 python train.py --test-init True --test-epoch 10 --output-dir &l...

PyTorch 和 CRNN 的验证码识别系统实现

热门推荐

weixin_41663412的博客

03-13

1万+

个人博客导航页（点击右侧链接即可打开个人博客）：大牛带你入门技术栈文字识别是AI的一个重要应用场景，文字识别过程一般由图像输入、预处理、文本检测、文本识别、结果输出等环节组成。其中，文本检测、文本识别是最核心的环节。文本检测方面，在前面的文章中已介绍过了多种基于深度学习的方法，可针对各种场景实现对文字的检测，详见以下文章：【AI实战】手把手教你文字识别（检测篇：MSER、CTPN...

beam search及pytorch实现

u014514939的博客

07-13

1万+

主要记录两种不同的beam search版本版本一，使用类似层次遍历的方式进行搜索，用队列进行维护，每次循环对当前层的所有节点进行搜索，这些节点每个分别对应topk个节点作为下一层候选节点，取所有候选节点的前tok个作为下一层节点加入队列 bfs with width constraint. 启发式搜索的一种. 属于贪心算法. 如果k -> inf，那么等价于bfs. 从根节点开始（），...

【AI实战】手把手教你文字识别（识别篇：LSTM+CTC, CRNN, chineseocr方法）

开源中国博客搬家测试账号

07-07

9664

文字识别是AI的一个重要应用场景，文字识别过程一般由图像输入、...

pytorchOCR之CRNN

BADBADBADBOY的博客

02-28

1490

pytorchOCR之CRNN 这里就不做crnn的原理解释了，网上一大堆。这里按照代码的思路梳理一遍crnn的流程。 crnn 流程首先，网络的输入是batchsize∗channel∗h∗wbatchsize*channel*h*wbatchsize∗channel∗h∗w，这里我们举个例子，假设输入为64∗3∗32∗28064*3*32*28064∗3∗32∗280,先经过backbone，一般backbone设计是在高度方向向下pooling 32倍，也就是5个stride 为2 ，将图片高度变成

crnn.pytorch, 在pytorch中，卷积递归网络.zip

09-17

crnn.pytorch, 在pytorch中，卷积递归网络基于的卷积递归神经网络软件在pytorch中实现了卷积递归神经网络( CRNN ) 。原始软件可以在 crnn 找到。运行演示在 src/demo.py 中可以找到一个演示程序。在运行演示之前，从百度 Netdisk 或者 Dro

CRNN完整源码实现--用PyTorch攻陷文字识别

05-18

CRNN-Pytorch 记录CRNN的学习 CRNN是2015年提出的一种，端对端的，场景文字识别方法，它采用CNN与RNN的结合来进行学习。它相对于其他算法主要有以下两个特点：端对端训练，直接输入图片给出结果，而不是把多个训练好的模型进行组合来识别不需要对图片中的文字进行分割就可以进行识别，可以适应任意长度的序列里面包括所有的代码，可以进行训练，本代码是训练了IIIIT-5k的数据集，得到了模型在文件夹内，可以进行训练和预测除此之外，ipynb文件中，利用pytorch搭建CRNN，对验证码进行识别，准确率都是很不错的，达到很不错的结果，可以自定图片和网络结构

crnn-ctc-loss-pytorch:使用 PyTorch 框架使用 CRNN 和 CTC 损失进行多位序列识别

05-29

使用 PyTorch 框架使用 CRNN 和 CTC 损失进行多位序列识别训练结果测试结果

CRNN——pytorch + wrap_ctc编译，实现pytorch版CRNN

aift的专栏

05-19

4912

简介 CTC可以生成一个损失函数，用于在序列数据上进行监督式学习，不需要对齐输入数据及标签，经常连接在一个RNN网络的末端，训练端到端的语音或文本识别系统。CTC论文本文主要是讲解用wrap_ctc实现pytorch版本的CRNN，用其来进行OCR端到端文本识别。（注：wrap_ctc是百度开源的一个模块，需要自己编译使用。在pytorch 1.0中，自带了CTC loss，用pytorch 1...

pytorch版crnn网络框架

weixin_52646021的博客

12-15

1993

这是我们常见的pytorch版的crnn网络框架，我遵循老师的想法，用C++和libtorch也搭建了一个一模一样的框架，主要是用来部署用的，我暂时把libtorch版本的代码放到了私密文章里面，还没有公开，有需要的私信我 import torch.nn as nn import torch.nn.functional as F from collections import OrderedDict class BidirectionalLSTM(nn.Module): # Inputs hidde

pytorch crnn笔记（一）

juluwangriyue的博客

09-26

1189

最近在看ocr识别，就尝试了一下pytorch的crnn。 https://github.com/meijieru/crnn.pytorch 有一个lmdb库原来没有安装，网上参考的安装办法大多都是： conda install -c conda-forge python-lmdb 我尝试用这种方法安装，还是安装失败，主要可能是找不到这个库，或者下载不下来。我的解决办法是下载下来本地安装。从https://conda.anaconda.org/conda-forge/win-64/下载p.

Pytorch crnn 笔记（三）

juluwangriyue的博客

11-04

677

本想自己从头写起，查了一下有人实现过，那我就只剩验证和改善的工作了。参考博客：Pytorch模型部署 - Libtorch(crnn模型部署) Step1: 模型转换将pytorch训练好的crnn模型转换为libtorch能够读取的模型． #covertion.py import torch import torchvison model = CRNN(32, 1, len(keys.alphabetEnglish) + 1, 256, 1).cpu() state_dict = tor

pytorch+CRNN实现

qq_33782623的博客

07-15

3233

最近接触了一个仪表盘识别的项目，简单调研以后发现可以用CRNN来做。但是手边缺少仪表盘数据集，就先用ICDAR2013试了一下。结果遇到了一系列坑。为了不使读者和自己在以后的日子继续遭罪。我把正确的代码发到下面了。 1）超参数请不要调整！！！！CRNN前期训练极其离谱，需要良好的调参，loss才会慢慢下降。我给出了一个训练曲线，可以看到确实贼几把怪，七拐八拐的。 2）千万不要用百度开源的那个ctc！！！网络代码： #crnn.py import torch.nn as nn import torc

crnn pytorch 训练、测试

无左无右的博客

03-11

3379

1.仓库地址 https://github.com/meijieru/crnn.pytorch 原版用lua实现的：https://github.com/bgshih/crnn 需要用到的warp_ctc_pytorch： https://github.com/SeanNaren/warp-ctc 2.环境安装普通的环境都可以吧，我是cuda10.0，torch1.2.0 python3.6...