计算机视觉
文章平均质量分 96
挪木鸥玩数据
联系方式:nuomuo@qq.com
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
发票、表格、铭牌等场景的信息提取技术解析与代码复现
从一张图片中识别出所有的文本数据是最常见的OCR任务,现在市场上有很多开源的端到端模型可以实现,如百度开源的PaddleOcr等。但如果我们的任务是要提取出图片中关键的信息(不光识别出文字,还要知道文字的意义),这时通用的全文OCR就不能胜任了,往往需要对全文OCR的结果进行后处理。比如,现在我需要提取出一张身份证照片中的个人信息,最后得到{'姓名':'张三','性别':'男'}这样的kv键值对的格式,如果只进行文本OCR,当然可以一股脑的提到照片中的所有文本,但后续怎么知道文本“张三”是姓名呢?原创 2024-05-23 09:59:39 · 2019 阅读 · 0 评论 -
【计算机视觉】基于YOLOv8的关键点检测的仪表盘读数方案详解
使用yolov8进行压力表的表盘读数原创 2024-03-20 17:44:58 · 8569 阅读 · 41 评论
分享