自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

nuomuo的博客

原创发票、表格、铭牌等场景的信息提取技术解析与代码复现

从一张图片中识别出所有的文本数据是最常见的OCR任务，现在市场上有很多开源的端到端模型可以实现，如百度开源的PaddleOcr等。但如果我们的任务是要提取出图片中关键的信息（不光识别出文字，还要知道文字的意义），这时通用的全文OCR就不能胜任了，往往需要对全文OCR的结果进行后处理。比如，现在我需要提取出一张身份证照片中的个人信息，最后得到{'姓名'：'张三','性别':'男'}这样的kv键值对的格式，如果只进行文本OCR，当然可以一股脑的提到照片中的所有文本，但后续怎么知道文本“张三”是姓名呢？

2024-05-23 09:59:39 2019 1

原创【计算机视觉】基于YOLOv8的关键点检测的仪表盘读数方案详解

使用yolov8进行压力表的表盘读数

2024-03-20 17:44:58 8569 42

原创【数据治理】我对数据治理的理解

数据开发治理一体化整体逻辑：先设计，再开发；将数据治理的流程自然融入数据开发的全生命周期过程中，在数据开发的过程中完成数据治理

2023-10-19 14:17:17 1542

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除