
OCR
文章平均质量分 93
光学字符识别或光学字符阅读器( OCR ) 是将打字、手写或印刷文本的图像通过电子或机械方式转换为机器编码的文本,这些文本可以来自扫描文档、文档照片、风景照片(例如风景照片中的标志和广告牌上的文字)或叠加在图像上的字幕文本(例如来自电视广播)。[ 1 ]
hsling松子
百度飞桨PPDE | Kaggle Competition expert | 算法爱好者
展开
-
PP-ChatOCRv3—文档场景信息抽取v3产线使用教程
文档场景信息抽取v3(PP-ChatOCRv3)是飞桨特色的文档和图像智能分析解决方案,结合了 LLM 和 OCR 技术,一站式解决版面分析、生僻字、多页 pdf、表格、印章识别等常见的复杂文档信息抽取难点问题,结合文心大模型将海量数据和知识相融合,准确率高且应用广泛。文档场景信息抽取v3产线中包含表格结构识别模块版面区域检测模块文本检测模块文本识别模块印章文本检测模块文本图像矫正模块文档图像方向分类模块。原创 2024-10-21 19:14:26 · 2467 阅读 · 0 评论 -
PP-Structure 快速入门
PP-Structure是PaddleOCR团队研发的智能文档分析系统,旨在帮助开发者更好地完成版式分析、表格识别等文档理解相关的任务。原创 2024-10-01 16:02:57 · 2031 阅读 · 0 评论 -
2024年最新新手掌握PaddleOCR使用(训练自己数据集与知识蒸馏)
由于框架在不断迭代,最新版的指导希望能帮助新手掌握训练自己的数据集与知识蒸馏过程原创 2024-09-11 23:27:28 · 11463 阅读 · 3 评论 -
基于Flask框架的PaddleOCR部署与应用
PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者训练出更好的模型,并应用落地。Flask是一个使用 Python编写的轻量级 Web 应用框架。本项目旨在将PaddleOCR部署在Flask上,方便调用。原创 2024-08-26 13:06:19 · 898 阅读 · 1 评论 -
AI OCR文本生成器—文本,图像,字体,词典合成OCR数据集
欢迎来到AI OCR文本生成器专栏,这是一个专注于深度学习OCR(光学字符识别)模型训练的文本生成工具的专业平台。在这里,您将了解如何使用该工具生成训练CRNN等OCR模型所需的文本行图像。我们的工具采用模块化设计,允许您轻松添加各种组件,如不同类型的语料库(Corpus)、图像效果(Effect)和布局(Layout)。该工具还与图像增强库完美集成,支持在图像生成的各个阶段应用不同的效果。无论是生成垂直文本,还是为PaddleOCR生成兼容的lmdb数据集,这款工具都能满足您的需求。原创 2024-08-20 15:52:28 · 1288 阅读 · 0 评论 -
PaddleOCR部署—使用 EdgeAI 相机 OpenNCC 开发 Raspberry Pi OCR
PaddleOCR部署—光学字符识别 (OCR) 或光学字符阅读器是将打字、手写或打印文本的图像电子或机械转换为机器编码文本。此过程可应用于各种来源,例如扫描文档、文档照片、场景照片(例如,标志和广告牌上的文字)或电视广播中的字幕文字。OCR 广泛用于将印刷文本数字化,以进行电子编辑、搜索、紧凑存储、在线显示和各种机器处理,包括认知计算、机器翻译、文本转语音和文本挖掘。它是一个涉及模式识别、人工智能和计算机视觉的跨学科领域。原创 2024-08-20 15:23:11 · 825 阅读 · 0 评论 -
PaddleOCR缅甸语OCR文本渲染数据
欢迎来到AI OCR文本生成器专栏,这是一个专注于深度学习OCR(光学字符识别)模型训练的文本生成工具的专业平台。在这里,您将了解如何使用该工具生成训练CRNN等OCR模型所需的文本行图像。我们的工具采用模块化设计,允许您轻松添加各种组件,如不同类型的语料库(Corpus)、图像效果(Effect)和布局(Layout)。该工具还与图像增强库完美集成,支持在图像生成的各个阶段应用不同的效果。无论是生成垂直文本,还是为PaddleOCR生成兼容的lmdb数据集,这款工具都能满足您的需求。原创 2024-08-20 10:45:30 · 1259 阅读 · 0 评论