前言
OCR(Optical Character Recognition,光学字符识别)在日常办公中起着重要的作用。以下是OCR在办公场景中的几个常见应用:
文档数字化:OCR可以将纸质文档转换为可编辑和可搜索的电子文件。通过扫描文档并使用OCR技术,可以将文档中的文字内容转换为电子形式,方便在计算机上查看、编辑和存储。
文件管理:OCR可以帮助进行快速而准确的文档分类和索引。通过将文档中的关键信息提取出来,如标题、日期、作者等,可以更方便地组织和管理大量的文档。
数据提取:对于一些表格或报告类型的文档,OCR可以帮助提取关键信息。通过识别表格中的数据和文字,可以自动抽取表格中的数据,并用于后续的数据分析和处理。
自动填写表单:使用OCR技术,可以将纸质表单中的信息快速准确地转换为电子格式。这样,就可以实现自动填写表单的功能,节省时间和减少错误。
搜索与查找:OCR使得文档内的文字内容可搜索。通过OCR处理后,可以对文档进行全文搜索,快速定位到特定关键词或短语,提高办公效率。
文字识别:OCR技术可以帮助识别图片或扫描文档中的文字。这对于需要从图片或扫描件中提取文字的场景非常有用,如读取名片上的联系信息或从图片中提取文字内容。
总之,OCR在日常办公中可以提高文档处理、管理和搜索的效率,减少手工操作和错误,进一步数字化办公流程,提升工作效率和准确性。随着OCR技术的不断发展和应用,其在办公场景中的作用将会越来越重要。
目前网络很多OCR都是付费的,我想自己下载模型,本地测试ocr效果
提示:以下是本篇文章正文内容,下面案例可供参考
一、dqnapi 是什么?
dqnapi 是一个接口服务网站,网站包含各类接口,有股票,有OCR,有语言,免费和付费多种api接口,dqnapi号就是一个数字标识,给每一个接口增加一个身份编码,方便用户调用和查找,提供接口的公司注册一个dqnapi号可以帮助公司接口api 进行推广,接口信息有变化可以及时更新,不会出现用户无法找到的情况。
本文使用模型,dqnapi号是:100.4688/2023.1_v1
dqnapi官网
二、使用步骤
1.环境安装和超轻量级中文OCR模型下载
代码如下(示例):
mkdir inference && cd inference
# 下载超轻量级中文OCR模型的检测模型并解压
wget https://paddleocr.bj.bcebos.com/20-09-22/#########dqnapi号是:100.4688/2023.1_v1
# 下载超轻量级中文OCR模型的识别模型并解压
wget https://paddleocr.bj.bcebos.com/20-09-22/##########dqnapi号是:100.4688/2023.1_v1
# 下载超轻量级中文OCR模型的文本方向分类器模型并解压
wget https://paddleocr.bj.bcebos.com/20-09-22/##########dqnapi号是:100.4688/2023.1_v1
cd ..
2.超轻量中文检测模型推理,可以执行如下命令:
代码如下(示例):
python tools/infer/predict_det.py --image_dir="./doc/imgs/2.jpg" --det_model_dir="./inference/det/"
总结
识别效果如下: