PaddleOCR——the first week_paddleocr代码详解 predict system-优快云博客

本文链接：https://blog.youkuaiyun.com/ScarlettWX/article/details/120517436

2021SC@SDUSC

分组：

组长：佟义哲博客链接：https://blog.youkuaiyun.com/shy2218

组员：

郑茜 https://blog.youkuaiyun.com/pinkray_c?spm=1010.2135.3001.5343

贾颖欣 https://blog.youkuaiyun.com/weixin_45873017

耿杉杉 https://blog.youkuaiyun.com/scarlettwx
选题：PaddleOCR代码分析网址https://gitee.com/paddlepaddle/PaddleOCR
分工：(每周更新)

分为文字检测组和文字识别组：

文字检测：佟义哲，耿杉杉（包含方向分类器）

文字识别：贾颖欣，郑茜
1. 第一周任务(10/01-10/08)
  1. 分析PaddleOCR的大体框架，并能用自己的语言描述。
  2. 分析PaddleOCR的包结构，明确接下来分析的重点和难点。
  3. 分析PaddleOCR论文，doc/PPOCR.pdf · PaddlePaddle/PaddleOCR - 码云 - 开源中国 (gitee.com)，并根据论文内容积累分析前序知识，方便后续开展详细分析。

4.代码的下载和安装配置
我从Gitee上下载了PaddleOCR-release-2.2，程序的运行是在PyCharm。
对于中文OCR模型快速使用，我下载了官方提供的用于中英文超轻量OCR模型的检测和识别的inference模型，其中包括检测、分类和识别三部分。下载完毕后将这三部分所在的文件夹放到一个名为inference的文件夹之下，并新建inference_results文件夹作为识别后图片的存放文件夹。代码的tools文件夹之下的infer文件夹的predict_system.py中也要添加相应的代码来指引服务器找到模型。之后在PyCharm的terminal上输入命令行就可以使用中英超轻量OCR模型了。
运行中出现的问题主要是因为官方给的命令行在电脑上不适用。官方命令为python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_ppocr_server_v2.0_det_infer/" --rec_model_dir="./inference/ch_ppocr_server_v2.0_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls=True --use_space_char=True。实际使用中输入此命令行会出现地址不对的问题。我查阅了优快云上的文章后发现，img_dir、det_model_dir等参数，在源码中已规定为字符串，所以再使用双引号("")，就导致路径不对，去掉双引号即可，而且python3要换成python。更改后为python tools/infer/predict_system.py --image_dir=./doc/imgs/test_train.jpg --det_model_dir=./inference/ch_ppocr_mobile_v1.1_det_infer/ --rec_model_dir=./inference/ch_ppocr_mobile_v1.1_rec_infer/ --cls_model_dir=./inference/ch_ppocr_mobile_v1.1_cls_infer/ --use_angle_cls=True --use_space_char=True --use_gpu=False。
如果要实现其他语言的文字提取只需更换相应的inference模型。
具体的程序原理分析将在以后的时间进行。