PaddlePaddle笔记3-小模型OCR

最新推荐文章于 2025-03-24 14:38:31 发布

外码斯迪

最新推荐文章于 2025-03-24 14:38:31 发布

阅读量3.1k

点赞数 1

分类专栏： ocr AI PaddlePaddle 文章标签： ocr ai 机器学习 python

本文链接：https://blog.youkuaiyun.com/zj850324/article/details/121764514

版权

睿洛医疗

参考官方示例

目标：OCR非结构化图像文字识别

支持：中文、英文

流程：
    输入图像 》》 图像预处理 》》 文字监测 》》 文字识别 》》 输出结构文本

补充安装模块：
    pip install paddlehub

TODO：
    1，大模型识别不到；
    2，小模型置信度调到 0.2，大段文本也存在很大程度的丢失。

引入包：

import paddlehub as hub
import cv2

预测：

def ocr_action(model_name,in_img_dir,in_filelist_txt,out_path):
    ocr = hub.Module(name=model_name)
    with open(in_filelist_txt, 'r') as f:
        img_path = []
        for line in f:
            filename = line.strip()
            img_path.append(filename)

    np_images = [cv2.imread(in_img_dir + image_