- 博客(3)
- 收藏
- 关注
原创 发票、表格、铭牌等场景的信息提取技术解析与代码复现
从一张图片中识别出所有的文本数据是最常见的OCR任务,现在市场上有很多开源的端到端模型可以实现,如百度开源的PaddleOcr等。但如果我们的任务是要提取出图片中关键的信息(不光识别出文字,还要知道文字的意义),这时通用的全文OCR就不能胜任了,往往需要对全文OCR的结果进行后处理。比如,现在我需要提取出一张身份证照片中的个人信息,最后得到{'姓名':'张三','性别':'男'}这样的kv键值对的格式,如果只进行文本OCR,当然可以一股脑的提到照片中的所有文本,但后续怎么知道文本“张三”是姓名呢?
2024-05-23 09:59:39
2019
1
原创 【数据治理】我对数据治理的理解
数据开发治理一体化整体逻辑:先设计,再开发;将数据治理的流程自然融入数据开发的全生命周期过程中,在数据开发的过程中完成数据治理
2023-10-19 14:17:17
1542
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅