环境准备:
- python
我的是python3.7(python3.8尝试失败)
- 安装pip
一、升级pip
python -m pip install --upgrade pip
二、安装Paddle
1.安装cpu版本paddle
命令行输入
python -m pip install paddlepaddle==2.0.0rc1 -i https://mirror.baidu.com/pypi/simple
2.在github上下载paddleocr项目
https://github.com/PaddlePaddle/PaddleOCR.git
3.安装第三方库,在命令行在PaddleOCR目录下,
pip3 install -r requirements.txt
若是pip3报错,可尝试改为pip
pip install -r requirements.txt
我在安装过程发生错误,若有同样的错误
解决方法跳转至下页面
https://blog.youkuaiyun.com/gl620321/article/details/112908147
4.模型下载
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/quickstart.md
全部安装完成之后
命令行在PaddleOCR目录下cd 到PPOCRLabel
输入python PPOCRLabel.py --lang ch
就可以打开PPOCRLabel
导入要识别的文件,导入后是这样
注:导入的文件必须是英文的,从导入的盘开始,不可出现英文
若是没有识别的文字可自行手动标记
识别后发生错误可在右侧相应的文本框双击,自行修改
可以看到命令行运行数据