中文OCR场景文字检测工具cnstd、文本框文字识别工具cnocr调试评测

Python3.11

Python3.11

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

这款很好用的工具项目地址为:https://github.com/breezedeus/cnstd
目前基于PyTorch开发

首先需要安装相关依赖:

 pip install cnstd
 pip install cnocr

我们采用以下图片进行测试,命名为lining.png:

运行样例测试程序:

from cnstd import CnStd
from cnocr import CnOcr

std = CnStd()
cn_ocr = CnOcr()

box_infos = std.detect('../examples/lining.png', resized_shape=(768, 1024))

print(len(box_infos['detected_texts']))
for box_info in box_infos['detected_texts']:
    cropped_img = box_info['cropped_img']
    ocr_res = cn_ocr.ocr_for_single_line(cropped_img)
    print('ocr result: %s' % str(ocr_res))

模型需要先对图片进行缩放,之后才能进行预测,其中,std.detect 的 resized_shape 可以自行设置,但必须是32的倍数,此处设置为跟图片自身分辨率接近的值:(768, 1024))运行程序后,报错为:

Traceback (most recent call last):
  File "D:/dev/cnstd-master/test

您可能感兴趣的与本文相关的镜像

Python3.11

Python3.11

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值