Tensorflow和Keras实现端到端的不定长中文字符检测和识别

一枚爱吃大蒜的程序员

于 2023-02-21 19:43:37 发布

阅读量217

点赞数

分类专栏：人工智能文章标签： Tensorflow Keras 不定长中文字符检测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/qiqi_ai_/article/details/129148788

版权

人工智能专栏收录该内容

34 篇文章

订阅专栏

该资源提供了基于CTPN进行文本检测和DenseNet+CTC进行文本识别的完整代码，包括环境部署脚本shsetup.sh。训练数据集包含364万张图片，涵盖多种字符类型。训练过程分为CTPN和DenseNet+CTC两个步骤，训练好的模型在验证集上达到0.9838的准确率。此外，还支持生成自定义样本。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

完整代码：https://download.youkuaiyun.com/download/weixin_55771290/87473303

文本检测：CTPN

文本识别：DenseNet + CTC

环境部署

sh setup.sh

注：CPU环境执行前需注释掉for gpu部分，并解开for cpu部分的注释

Demo

将测试图片放入test_images目录，检测结果会保存到test_result中

python demo.py

模型训练

CTPN训练

详见ctpn/README.md

DenseNet + CTC训练

1. 数据准备

数据集：https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw (密码：lu7m)

共约364万张图片，按照99:1划分成训练集和验证集

数据利用中文语料库（新闻 + 文言文），通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成

包含汉字、英文字母、数字和标点共5990个字符

每个样本固定10个字符，字符随机截取自语料库中的句子

图片分辨率统一为280x32
图片解压后放置到train/images目录下，描述文件放到train目录下

2. 训练

cd train
python train.py

3. 结果

val acc predict model

0.983 8ms 18.9MB

GPU: GTX TITAN X

Keras Backend: Tensorflow

4. 生成自己的样本

可参考SynthText_Chinese_version，TextRecognitionDataGenerator和text_renderer

效果展示

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

一枚爱吃大蒜的程序员 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。