caffe学习记录(九) CRNN+BLSTM+CTC OCR识别,后续加上SSD做检测

本文分享了一种基于Densenet和双Lstm的OCR检测方案,通过Warp-CTC进行去重定向,实现了快速且高精度的字符识别。作者在Linux环境下进行了英文自然场景的识别实验,并计划结合MobileNet-SSD进行场景检测。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

https://github.com/senlinuc/caffe_ocr源代码在此,是基于senlnuc的模型进行学习的。

好长时间没更新学习博客了,之前一直在忙着做基网络模型的评测,以及tesseract 和其他Ocr的研究等。

更新一下最近学习的OCR检测,要求是速度要快,准确度要相对较高!

整个操作流程:

先用卷积进行特征提取,这里我用的是Densenet的模型,然后用双Lstm进行不定长处理,然后接上warp-ctc进行去重定向。

作者中文字符识别的准确率如下表:

我是基于linux进行的英文自然场景英文识别,目前还在识别的训练阶段,接下来会加上自然场景的检测,暂定用mobileNet-ssd。训好后会放出评测

 

转载于:https://www.cnblogs.com/ChrisInsistPy/p/9779591.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值