ocr(2)-crnn-mxnet-chinese-text-recognition

本文档详细介绍了如何在Ubuntu 16.04环境下使用GTX 1080显卡安装配置MXNet和warp-ctc的过程,包括安装所需的依赖项、设置环境变量及编译配置等关键步骤,并提供了训练CRNN模型的具体方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

ubuntu 16.04
GTX1080
Mxnet 最新
pytho 2.7

1. 安装Mxnet

Mxnet 按照参考官网,选择源码GPU安装。

2. 安装warp-ctc

安装warp-ctc

$ git clone https://github.com/baidu-research/warp-ctc.git
$ cd warp-ctc
$ mkdir build
$ cd build
$ cmake ../
$ make

(更详细内容请看官网)

3. 安装mxnet-warp-ctc

进入到mxnet根目录
$ cd mxnet
$ make clean
在make/config.mk 添加warp-ctc 路径
$ echo 'WARPCTC_PATH = $(HOME)/warp-ctc' >>config.mk
$ echo 'MXNET_PLUGINS += plugin/warpctc/warpctc.mk' >>config.mk
其中"$(HOME)" 为warp-ctc所在的根目录,如果路径不对会编译不通过
重新编译mxnet
$ make -j $(nproc) USE_OPENCV=1 USE_BLAS=openblas USE_CUDA=1 USE_CUDA_PATH=/usr/local/cuda USE_CUDNN=1
重新编译python
如果找不到libwarpctc.so ,在warp-ctc/build中把libwarpctc.so 复制到/usr/lib/
  1. 下载 crnn-mxnet-chinese-text-recognition 并训练
$ git https://github.com/diaomin/crnn-mxnet-chinese-text-recognition.git
数据集train.txt格式
 image_name1 label1_1 label1_2 label1_3...
如图片1.jpg 上面的标签是hello
train.txt1.jpg h e l l o

训练

$ python train.py 2>&1 | tee log.txt

参考文献
[1] https://mxnet.incubator.apache.org/install/index.html
[2]https://github.com/alues/Mxnet_Install_Script/blob/master/Install_Mxnet.sh
[3] https://github.com/baidu-research/warp-ctc
[4] https://github.com/diaomin/crnn-mxnet-chinese-text-recognition

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值