
OCR
文章平均质量分 94
OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
本专栏主要介绍各种常用OCR,以及分享特殊情况或需求下的OCR解决方案
watermelo37
合作请+v:Watermelo617,备注说明来意。一个假装是giser的coder,做不只专注于业务逻辑的前端工程师,java、docker、数据库、python、LLM均有涉猎。提问最好私信,评论容易漏掉,欢迎互关,欢迎讨论,一起进步!
展开
-
使用OCR库Pix2Text执行p2t.recognize()时出现list index out of range的错误信息(附有Pix2Text识别图片内容和laTex公式的代码)
1、如何通过python使用Pix2Text识别图片。2、使用Pix2Text识别图片时出现list index out of range的错误信息的原因及解决方案原创 2024-03-23 15:19:47 · 2510 阅读 · 3 评论 -
对双栏 | 单双栏混合 | 图表文字混合的复杂布局的图片OCR识别(对布局复杂的整个pdf进行OCR识别)
1、解决对布局复杂的论文PDF进行OCR识别的难点。2、解决常规OCR识别会导致双列布局被识别为一列从而结果混乱的问题。原创 2024-03-28 22:02:14 · 3143 阅读 · 1 评论