PaddleOCR 模块功能说明

昔颜1121

已于 2024-12-13 22:31:11 修改

阅读量710

点赞数 8

分类专栏： padlle 文章标签：人工智能 paddle

于 2024-12-13 22:30:53 首次发布

本文链接：https://blog.youkuaiyun.com/qq_56640350/article/details/144461174

版权

padlle 专栏收录该内容

2 篇文章

订阅专栏

det（文本检测）
- 用于检测图片中的文字位置，生成文字框的坐标信息。
- 适合需要识别图片中多处文字位置的任务，例如文档扫描中的文字区域检测。
- 不适合您当前的数据，因为您的数据没有坐标信息。
rec（文本识别）
- 用于识别图片中的文字内容，从图像直接转换为文本标签。
- 适合您提供的数据格式（图片路径 + 文本标签），无需坐标信息。
- 您的场景需要选择这个模块。
cls（方向分类）
- 用于分类图片中的文字方向（0度、90度、180度或270度）。
- 通常用于检测和识别任务之间的预处理步骤。
- 如果您的图片方向已标准化，不需要使用。
e2e（端到端OCR）
- 直接从图片生成检测框和对应的文字内容。
- 适合需要同时完成检测和识别的任务。
- 不适合您的场景，因为您只有识别任务。
kie（关键信息抽取）
- 从图片中提取关键信息，例如表单中的特定字段内容。
- 适合结构化信息提取任务（如发票、合同分析）。
- 不适合您的场景。
sr（超分辨率重建）
- 用于提高低分辨率图像的清晰度，为后续识别任务提供更好的图像质量。
- 可作为预处理步骤，如果图片分辨率较高，则不需要使用。
table（表格识别）
- 用于检测和识别表格结构，包括单元格内容和表格位置。
- 专门处理表格类场景，不适合普通文字识别。