paddle识别


"""
1.新建一个env
需要 python 3.8(版本太高可能paddle会有问题,之前使用python3.10paddle引用其他库出现问题)
conda create -n paddle python=3.8
conda activate paddle
2.安装paddle(2.1和2.2选一)
2.1安装paddle[gpu]版本
python -m pip install paddlepaddle-gpu==3.0.0rc1 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/
2.2没有gpu的话安装cpu版本
python -m pip install paddlepaddle==3.0.0b2 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/
3.安装paddleocr
pip install paddleocr
"""

from paddleocr import PaddleOCR
import os
import time

# 装饰器计算耗时
def timeit(func):
    def wrapper(*args, **kwargs):
        start_time = time.time()
        result = func(*args, **kwargs)
        end_time = time.time()
        print(f"函数 {func.__name__} 执行时间为 {end_time - start_time} 秒")
        return result

    return wrapper


# 识别结果
@timeit
def ocr_result(img_path):
    temp = []
    result = ocr.ocr(img_path, det=False, cls=False)
    for idx in range(len(result)):
        res = result[idx]
        for line in res:
            _ =list(line)
            if len(_) == 2:
                temp.append({"result":_[0],"置信度":_[1]})
    return temp

# 可选语言
# ch: 中文 en: 英文
print("加载模型")
ocr = PaddleOCR(lang='ch')
print("模型加载完成")
# 需要去识别的图片文件夹
_dir_path = "./source"
for item in os.listdir(_dir_path):
    t = os.path.join(_dir_path, item)
    res = ocr_result(t)
    print({"file":t,"result":res})

### PaddleOCR实现指定区域文字识别 PaddleOCR 是基于 PaddlePaddle 平台开发的光学字符识别(OCR)工具库,支持多种语言的文字检测与识别[^1]。要实现指定区域的文字识别,可以利用 PaddleOCR 的文本检测和识别功能对特定区域进行处理。以下是实现指定区域文字识别的核心方法和技术细节。 #### 1. 指定区域的图像裁剪 在使用 PaddleOCR 进行文字识别之前,首先需要从原始图像中提取出目标区域。可以通过以下方式实现: - 使用图像处理库(如 OpenCV 或 PIL)裁剪出指定区域。 - 确保裁剪后的图像包含完整的文字内容,并尽量减少背景干扰。 代码示例如下: ```python import cv2 # 加载图像 image = cv2.imread("input_image.jpg") # 定义指定区域 (x, y, width, height) x, y, w, h = 100, 100, 300, 200 cropped_image = image[y:y+h, x:x+w] # 保存裁剪后的图像 cv2.imwrite("cropped_image.jpg", cropped_image) ``` #### 2. 使用 PaddleOCR 进行文字识别 裁剪出目标区域后,可以将其传递给 PaddleOCR 进行文字识别PaddleOCR 提供了简单易用的 API 接口,可以直接加载模型并进行推理。 代码示例如下: ```python from paddleocr import PaddleOCR # 初始化 PaddleOCR ocr = PaddleOCR(use_angle_cls=True, lang="en") # 设置语言为英文 # 对裁剪后的图像进行识别 result = ocr.ocr("cropped_image.jpg", cls=True) # 输出识别结果 for line in result: print(line) ``` #### 3. 处理复杂场景下的文字识别 如果目标区域的文字存在扭曲、模糊或其他复杂情况,可以参考通用 OCR 的技术路线[^3],通过以下方式进行优化: - **数据增强**:在训练阶段引入更多类似场景的数据,提高模型的鲁棒性。 - **模型调优**:根据具体需求选择合适的预训练模型,并结合自己的数据进行微调[^2]。 - **后处理**:对识别结果进行校正,例如使用语言模型或规则匹配改进输出质量。 --- ### 注意事项 - 如果目标区域较小或文字较少,建议调整模型参数以适应小尺寸文字识别- 在实际应用中,可能需要结合图像预处理技术(如二值化、去噪等)提升识别效果。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值