
OCR
文章平均质量分 89
发呆小天才O.o
努力努力再努力
展开
-
OCR文字识别—基于PP-OCR模型实现ONNX C++推理部署
PaddleOCR 是一款基于 PaddlePaddle 深度学习平台的开源 OCR 工具。PP-OCR是PaddleOCR自研的实用的超轻量OCR系统。它是一个两阶段的OCR系统,其中文本检测算法选用DB,文本识别算法选用CRNN,并在检测和识别模块之间添加文本方向分类器,以应对不同方向的文本识别。PP-OCRv4 在速度可比的情况下,中文场景端到端 hmean 指标相比于 PP-OCRv3 提升 4.25%。英文数字场景,相比于 PP-OCRv3 英文模型提升 6%。原创 2025-01-10 14:11:16 · 2571 阅读 · 0 评论 -
文档处理——拍照文档OCR文字识别从算法原理到模型推理部署
OCR(Optical Character Recognition,光学字符识别)技术是一种将图像中的文字内容提取为可编辑的数字文本的技术。它能够识别图片中的印刷字体、手写字体,甚至复杂的表格和图形内容,实现从“图像”到“数据”的转换。也就是说将图象中的文字进行识别,并返回文本形式的内容。原创 2025-01-06 10:15:31 · 2880 阅读 · 0 评论 -
拍照文档处理——达到商用级别的基于语义分割与直线检测拍照文档边缘校正(使用NCNN进行推理部署)
文档图像的边缘校正是图像处理中的一项重要任务,尤其在文档数字化和自动化扫描过程中,确保文档图像的几何形状和内容准确性具有重要意义。传统的文档图像校正方法通常依赖于手动选择或简单的几何变换。然而,随着深度学习和计算机视觉技术的发展,语义分割与直线检测被广泛应用于文档边缘校正任务中,极大提高了处理的效率和精度。语义分割技术通过将图像中的每个像素进行分类,可以精准地提取出文档的边缘信息。在文档图像中,文档区域通常会被标记为一个特定的类别,而背景或其他元素则被分离出来。原创 2024-12-28 13:31:29 · 2156 阅读 · 0 评论