安装PPOCRLabel标注工具

一:安装 PaddlePaddle 2.0

  1. 在虚拟环境ppocr中安装,python版本3.7。
  2. 安装命令:pip3 install paddlepaddle -i https://mirror.baidu.com/pypi/simple/
    注:官方安装命令:python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
    出现报错:

二: 安装 PaddleOCR

命令:git clone https://github.com/PaddlePaddle/PaddleOCR
报错!
命令:git clone https://gitee.com/PaddlePaddle/PaddleOCR
成功!

三:安装第三方库

cd PaddleOCR 
pip3 install -r requirements.txt

四:安装PPOCRLabel

Windows

pip 
### 使用 PP-OCRLabel 进行数据标注 要在 Linux 环境下使用 PP-OCRLabel 工具进行数据标注,可以按照以下方法操作: #### 安装依赖项 首先需要安装运行 PP-OCRLabel 所需的依赖环境。PP-OCRLabel 基于 Python 和 PyQt5 构建,因此需要确保这些库已正确安装。 ```bash sudo apt-get update && sudo apt-get install python3-pip python3-tk libqt5widgets5 qtbase5-dev pyqt5-dev-tools pip3 install -r requirements.txt ``` 上述命令会更新系统的包管理器并安装必要的软件组件以及通过 `requirements.txt` 文件指定的 Python 库[^1]。 #### 下载与配置 PP-OCRLabel 下载最新的 PP-OCRLabel 版本,并解压到目标目录中。进入该目录后执行启动脚本即可加载 GUI 界面用于标注工作。 ```bash wget https://paddleocr.bj.bcebos.com/ppocrlabel/release/v2.0/PPOCRLabel_linux_x64.tar.gz tar zxvf PPOCRLabel_linux_x64.tar.gz cd PPOCRLabel/ ./start.sh ``` 当界面成功打开之后,可以通过菜单选项设置完整的 datasetRootPath 路径来指向存储图片文件夹的位置,默认情况下此路径设为 `PaddleOCR/train_data`。 #### 数据集结构准备 为了使工具能够正常读取和保存标注信息,在分割之前的数据集中应该具有特定层次化的目录布局形式。具体来说就是包含两个主要子文件夹——一个是用来放置裁剪后的图像片段 (`crop_img`);另一个则是原始未处理过的整张文档扫描件或者场景照片(`rec_gt.txt`) 及其对应的标签描述文件(Label.txt)。 完成以上步骤后就可以利用界面上的功能按钮开始逐帧标记感兴趣区域(ROI),同时自动生成相应的 ground truth 文字记录供后续训练模型时调用。 ```python import os def check_dataset_structure(root_path): required_dirs = ['crop_img', 'word_001_crop_0.png'] missing = [] for d in required_dirs: path = os.path.join(root_path, d) if not os.path.exists(path): missing.append(d) return f"All necessary directories exist." if not missing else f"Missing directories: {missing}" root_directory = "/path/to/dataset" print(check_dataset_structure(root_directory)) ``` 上面给出了一段简单的Python函数代码示例,它可以帮助验证给定根目录下的基本数据集构成是否满足需求标准。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值