
字符识别OCR
文章平均质量分 81
字符识别OCR相关知识
机器不学习我学习
优快云人工智能领域优质创作者,优快云博客专家,阿里云专家博主,阿里云技术博主,有机器学习、深度学习、OCR识别项目4年以上工作经验,【AIexplore】创始人,专注于人工智能技术领域。
展开
-
【OCR】OCR学习记录(5)--PaddleOCR中PPOCRLabel的安装
官方安装教程:https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/installation.md本博文记录windows环境下安装PPOCRLabel安装paddlepaddle:pip install paddlepaddle==2.0.2 -i https://mirror.baidu.com/pypi/simple安装paddleocr:pip install paddleocr终端运行:pytho原创 2021-10-09 10:58:15 · 1328 阅读 · 0 评论 -
【OCR】OCR学习记录(4)--PaddleOCR检测文本内容
百度开源的PaddleOCR项目地址:https://github.com/PaddlePaddle/PaddleOCR1、介绍在PaddleOCR识别中,会依次完成三种任务:检测、方向分类、文本识别关于预训练权重,PaddleOCR官网根据提供权重文件大小分为两类:一类为轻量级,(检测+分类+识别)三类权重加起来大小一共才9.4MB,适用于手机端和服务器部署;另一类(检测+分类+识别)三类权重加起来一共143.4MB,适用于服务器部署。(无论模型是否为轻量级,识别效果都能与商业效果相比原创 2021-10-08 15:32:21 · 1394 阅读 · 1 评论 -
【OCR】OCR学习记录(3)--EasyOCR介绍
1、介绍之前介绍过图片文本OCR识别,文章介绍了一个Python包pytesseract,该包是基于Tesseract封装得到的,这个包虽然支持多语言文本识别,但对于不同语言识别,准确率却不一样,例如英文识别准确率高,而中文文本识别率较低;英文字符识别,整体来看基本不错,但对于图片中的中文字符,经常出现乱码、识别失败的情况。2、EasyOCR今天介绍一个用于文本识别的新的Python包:EasyOCR,这个包是基于训练好的Deep Learning模型开发的,模型包含文本检测、文本识别功能;Easy原创 2021-10-08 14:17:53 · 4277 阅读 · 0 评论 -
【OCR】OCR学习记录(2)--Pytesseract介绍
文字OCR识别技术现在已经相当成熟了,无论是准确度还是识别速度都能满足我们日常生活的需要;今天介绍一个Python包,该包的主要功能就是用于OCR识别,包的名字为:Pytesseract,借助这个包几行代码就能快速识别一张文本图片。Pytesseract包是由开源工具Tesseract得到的,由Hewlett Packard实验室开发,在2005年实行开源;自2006年之后由谷歌和一些优秀的开源贡献者共同开发维护。Tesseract在3.x版本之后逐渐成熟,支持多种图片格式并且逐步加入多种语言文本识别;原创 2021-10-08 11:38:47 · 709 阅读 · 0 评论 -
【OCR】OCR学习记录(1)--定义、分类、流程、方法、发展
1. 什么是OCROCR英文全称是Optical Character Recognition,中文叫做光学字符识别。它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。文字识别是计算机视觉研究领域的分支之一,而且这个课题已经是比较成熟了,并且在商业中已经有很多落地项目了。比如汉王OCR,百度OCR,阿里OCR等等,很多企业都有能力都是拿OCR技术开始挣钱了。其实我们自己也能感受到,OCR技术确实也在改变着我们的生活:比如一个手机APP就能帮忙扫描名原创 2021-06-22 09:44:07 · 2263 阅读 · 0 评论