模式识别

本文介绍了模式识别的基本概念及其在计算机领域的应用,并重点探讨了OCR技术的工作原理与关键指标,如识别率、拒识率、误识率和识别速度。

source:http://www.blogjava.net/thinkingtalking/archive/2007/07/11/129543.html

模式识别,就是通过计算机用数学技术方法来研究模式的自动处理和判读。我们把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。市场上可见到的代表性产品有OCR(Optical Character Recognition),语音识别系统。

计算机识别的显著特点是速度快,准确性高,效率高。完全可以取代人工录入。

识别过程与人类的学习过程相似。以“汉字识别”为例:首先将汉字图象进行处理,抽取主要表达特征并将特征与汉字的代码存在计算机中。就象老师教我们这个字叫什么如何写记在大脑中。这一过程叫做“训练”。识别过程就是将输入的汉字图象经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。这一过程叫做“匹配”。

OCR还有一个重要组成部分是对具体对象的“版面分析”或称“分割”。属于图象处理范畴。比如在一篇文章中将每个独立的汉字切分出来;名片识别中要将每个字段切出来。切分的难度不亚于识别。

以下给出OCR的常用概念与技术指标:

识别率:正确识别的字符占所有测试字符的比例。是大量字符测试后的统计结果。
拒识率:无法识别(没有给出识别结果)的字符占所有测试字符的比例。
误识率:将甲识别成乙等识别错误的字符占所有测试字符的比例。
识别速度:基于某种速度计算机的识别一个字符的时间或一秒钟能识别字符的个数。
扫描分辨率:指扫描仪光学源的物理分辨率。分辨率越高获得的图象越清晰。

       那么人的模式识别是什么呢?看来主要的还是要依靠原先的认知结构。在专家记忆中有5到10万个组快,且都按照层次网络结构进行连接,而且易于提取。那么在认识或者学习新东西的时候,很容易对“模式”进行识别了。

 
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值