2021SC@SDUSC
-
分组:
组长:佟义哲 博客链接:https://blog.youkuaiyun.com/shy2218
组员:
郑茜 https://blog.youkuaiyun.com/pinkray_c?spm=1010.2135.3001.5343
贾颖欣 https://blog.youkuaiyun.com/weixin_45873017
耿杉杉 https://blog.youkuaiyun.com/scarlettwx
-
选题:PaddleOCR代码分析 网址https://gitee.com/paddlepaddle/PaddleOCR
-
分工:(每周更新)
分为文字检测组和文字识别组:
文字检测:佟义哲,耿杉杉(包含方向分类器)
文字识别:贾颖欣,郑茜
- 第一周任务(10/01-10/08)
- 分析PaddleOCR的大体框架,并能用自己的语言描述。
- 分析PaddleOCR的包结构,明确接下来分析的重点和难点。
- 分析PaddleOCR论文,doc/PPOCR.pdf · PaddlePaddle/PaddleOCR - 码云 - 开源中国 (gitee.com),并根据论文内容积累分析前序知识,方便后续开展详细分析。
- 第一周任务(10/01-10/08)
4.代码的下载和安装配置
我从Gitee上下载了PaddleOCR-release-2.2,程序的运行是在PyCharm。
对于中文OCR模型快速使用,我下载了官方提供的用于中英文超轻量OCR模型的检测和识别的inference模型,其中包括检测、分类和识别三部分。下载完毕后将这三部分所在的文件夹放到一个名为inference的文件夹之下,并新建inference_results文件夹作为识别后图片的存放文件夹。代码的tools文件夹之下的infer文件夹的predict_system.py中也要添加相应的代码来指引服务器找到模型。之后在PyCharm的terminal上输入命令行就可以使用中英超轻量OCR模型了。
运行中出现的问题主要是因为官方给的命令行在电脑上不适用。官方命令为python3 tools/infer/predict_system.py --image_dir="./doc/imgs/11.jpg" --det_model_dir="./inference/ch_ppocr_server_v2.0_det_infer/" --rec_model_dir="./inference/ch_ppocr_server_v2.0_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls=True --use_space_char=True
。实际使用中输入此命令行会出现地址不对的问题。我查阅了优快云上的文章后发现,img_dir、det_model_dir等参数,在源码中已规定为字符串,所以再使用双引号(""),就导致路径不对,去掉双引号即可,而且python3要换成python。更改后为python tools/infer/predict_system.py --image_dir=./doc/imgs/test_train.jpg --det_model_dir=./inference/ch_ppocr_mobile_v1.1_det_infer/ --rec_model_dir=./inference/ch_ppocr_mobile_v1.1_rec_infer/ --cls_model_dir=./inference/ch_ppocr_mobile_v1.1_cls_infer/ --use_angle_cls=True --use_space_char=True --use_gpu=False
。
如果要实现其他语言的文字提取只需更换相应的inference模型。
具体的程序原理分析将在以后的时间进行。