
OCR技术实践探索
文章平均质量分 94
本专栏以药盒生产日期识别为起点,逐步探索OCR技术的应用和实践。
程序员Linc
资深技术专家,专注移动开发与人工智能领域15年+
展开
-
OCR第三个方案:PP-OCRv4的初步探索
PP-OCRv3(2022):采用SVTR识别架构,中文识别准确率突破80%PP-OCRv4(2023):融合Transformer与CNN的混合架构,实现多维度性能突破原创 2025-03-31 20:00:00 · 1723 阅读 · 0 评论 -
探索OCR的第二个方案:EasyOCR
EasyOCR是由Jaided AI团队开发的开源OCR引擎,基于PyTorch深度学习框架构建,支持80+种语言的文本识别,包含简体中文(ch_sim)、繁体中文(ch_tra)、英语(en)等主流语言。多场景适应:支持自然场景文本、文档密集文本、手写体等多种类型端到端流程:集成CRAFT检测模型+CRNN识别模型的完整解决方案硬件加速:支持GPU加速推理(CUDA/MPS)与CPU模式灵活扩展:允许用户自定义识别网络和模型存储路径。原创 2025-03-30 10:00:00 · 843 阅读 · 0 评论 -
Tesseract OCR技术初探(Python调用)
Tesseract是由HP实验室于1985年研发的光学字符识别引擎,2005年由Google开源并持续维护至今。其核心技术经历了三个阶段演进:原创 2025-03-29 20:00:00 · 974 阅读 · 0 评论 -
药盒日期识别技术初步设想V1.0
硬件配置多光谱成像模块使用3组环形LED光源(白光、红外850nm、紫外365nm)多角度照射例:钢印在红外光下因材质吸热差异形成热成像轮廓,紫外光激发喷码荧光物质高速工业相机选型高速工业相机:例如Basler acA4112-20um(4096×3000分辨率,300fps),搭配远心镜头消除透视畸变触发同步装置光电传感器触发拍摄,确保药盒进入视场中心±2mm误差内成像参数优化钢印检测:采用偏振光成像抑制镜面反射,曝光时间≤1ms以避免运动模糊喷码检测:使用同轴光照明。原创 2025-03-29 10:00:00 · 647 阅读 · 0 评论