-
det
(文本检测)- 用于检测图片中的文字位置,生成文字框的坐标信息。
- 适合需要识别图片中多处文字位置的任务,例如文档扫描中的文字区域检测。
- 不适合您当前的数据,因为您的数据没有坐标信息。
-
rec
(文本识别)- 用于识别图片中的文字内容,从图像直接转换为文本标签。
- 适合您提供的数据格式(图片路径 + 文本标签),无需坐标信息。
- 您的场景需要选择这个模块。
-
cls
(方向分类)- 用于分类图片中的文字方向(0度、90度、180度或270度)。
- 通常用于检测和识别任务之间的预处理步骤。
- 如果您的图片方向已标准化,不需要使用。
-
e2e
(端到端OCR)- 直接从图片生成检测框和对应的文字内容。
- 适合需要同时完成检测和识别的任务。
- 不适合您的场景,因为您只有识别任务。
-
kie
(关键信息抽取)- 从图片中提取关键信息,例如表单中的特定字段内容。
- 适合结构化信息提取任务(如发票、合同分析)。
- 不适合您的场景。
-
sr
(超分辨率重建)- 用于提高低分辨率图像的清晰度,为后续识别任务提供更好的图像质量。
- 可作为预处理步骤,如果图片分辨率较高,则不需要使用。
-
table
(表格识别)- 用于检测和识别表格结构,包括单元格内容和表格位置。
- 专门处理表格类场景,不适合普通文字识别。
PaddleOCR 模块功能说明
于 2024-12-13 22:30:53 首次发布