动手RAG: ocr文字识别

原创已于 2024-09-18 11:09:33 修改

· 512 阅读

·

3

·

版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2024-07-02 17:08:58 首次发布

对于rag应用来说，文档是第一步，对于部分扫描件的文件来讲，主要就需要OCR.
在这里插入图片描述

OCR

还有诸如

chineseocr_lite
darknet-ocr
https://blog.youkuaiyun.com/CHYabc123456hh/article/details/107846268
easyocr

OCR包含几类，

自然场景中的文字识别，文档中的文字识别
pipeline: 文本检测，文本识别，文档结构化识别（版面分析，表格识别，关键信息提取）

在这里插入图片描述

表格识别

部署

pdf解析

文档解析

参考

https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR%E6%8A%80%E6%9C%AF%E5%AF%BC%E8%AE%BA.ipynb

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

YueTann 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。