OCR文字识别

OCR(光学字符识别)始于1929年,用于将纸质文档转换为可编辑的电子文本。该技术经历了从邮政编码识别到现在的开放场景应用,如名片识别、车牌识别和自动驾驶中的交通标志识别。OCR包括图像预处理、文字识别和理解,现代应用中常结合深度学习提升效果。开放场景下的OCR识别面临光照、形状和遮挡等挑战,需要更复杂的检测和识别算法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

OCR定义和起源

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。

OCR的概念是在1929年由德国科学家Tausheck最先提出来的,后来美国科学家Handel也提出了利用技术对文字进行识别的想法。

中国在OCR技术方面的研究工作起步较晚,在70年代才开始对数字、英文字母及符号的识别进行研究,70年代末开始进行汉字识别的研究,到1986年,我国提出“863”高新科技研究计划,汉字识别的研究进入一个实质性的阶段,清华大学的丁晓青教授和中科院分别开发研究,相继推出了中文OCR产品,现为中国最领先汉字OCR技术。

最早的OCR应用是信封上的邮政编码识别。这种技术被使用在了一个非常窄的场景里面,只是要求把填在空格里的数字稳定的有效的检索、识别出来。当时的识别概率能达到92%-93%。这解决一个很大的问题,当时邮寄信都是通过识别码来进行投递的。传统领域内的OCR识别其实与早期的邮政编码识别还是有非常大的相似性,在限定区域内识别文字,比如银行卡、票证、证件(身份证、行驶证、驾驶证)等。

OCR的作用

套用腾讯云戴永楠的话,“OCR就是为了让机器看懂文字”,他说的看懂指的是初步理解文字,并非是识别文字。

OCR的3个步骤,让机器看到文字---让机器认识文字----让机器看懂文字&#x

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值