ocr中的densenet网络训练或者fine-tune

本博客介绍如何在中文OCR项目中使用DenseNet网络进行训练,包括环境部署、数据准备及训练过程。数据集包含364万张图片,通过多种变化随机生成,用于训练识别汉字、英文字母等字符。

denseNetTrain

ocr中的densenet网络训练

简介

原项目是:https://github.com/YCG09/chinese_ocr

这个只是提供原项目中的densenet网络训练用的。原项目中没有fine-tune, 同时tensorboard使用时好像有点问题(不过使用tensorboard好像也看不到有用的信息)

环境部署

sh setup.sh # Linux环境用
  • 注:支持window和Ubuntu

1. 数据准备

数据集:https://pan.baidu.com/s/1QkI7kjah8SPHwOQ40rS1Pw (密码:lu7m)

  • 共约364万张图片,按照99:1划分成训练集和验证集

  • 数据利用中文语料库(新闻 + 文言文),通过字体、大小、灰度、模糊、透视、拉伸等变化随机生成

  • 包含汉字、英文字母、数字和标点共5990个字符

  • 每个样本固定10个字符,字符随机截取自语料库中的句子

  • 图片分辨率统一为280x32

  • 或者自己生成数据进行训练,生成数据的工具:https://blog.youkuaiyun.com/qq_31112205/article/details/103653176

图片解压到相应的位置,注意路径

2. 训练

将train.py和fine_tune_train.py中路径改成自己准备好的数据的位置

评论 35
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值