如果自然语言处理是人工智能皇冠上的一颗明珠,那么文字识别就是这颗明珠下不可或缺的底座。
关键词:人工智能、文字识别、人脸识别、花旗银行、OCR识别技术、准确率逼近100%
一句话提炼:基于OCR识别技术快速抓取图像中文字信息录入系统,节约相关从业人员95%的重复工作时间。
20世纪70年代以来,『空间技术』、『能源技术』以及『人工智能』被称为世界三大尖端技术,而随着人工智能近三十年来的迅速发展,无论是理论还是实践,人工智能已逐渐自成一体,并且在多个领域实现了完美的结合,推动产业实际的应用发展。
由于人类对世界的感知有约80%是通过眼睛来获取。因此在这其中,视觉感知或许称得上是话题最多,也是最被大众熟知的分支之一,典型的技术包括图像识别、人脸识别以及视频监控等等。
然而人们了解、学习这个社会更多的还是通过文字,但是文字识别技术却一直没有得到应有的关注,所谓的文字识别指的是利用计算机自动识别字符的技术。业界将自然语言处理誉为人工智能皇冠上的一颗明珠,那么文字识别则是这颗明珠下不可或缺的底座,没有文字识别技术将纸张或图片上的文字提取出来,机器也就无法进行后续的语义理解。
事实上,从上个世纪80、90年代开始,文字识别就已经在国外的表单名片识别、邮政编码及自动分拣、票据自动处理等领域得到了广泛的应用,大大降低了人力成本以及人工所导致的高误差率。
也正是在文字识别技术高速发展的时期,『微模式』创始人陈友斌从清华大学博士毕业,随后便赴美国科罗拉多州立大学继续深造,并在之后的2、30年间专注于自动目标识别、图像识别、机器视觉等领域的研究。
陈友斌博士告诉我们,『当时我带领团队主持研发的英文票据自动化识别系统,一度做到了世界第一,占领了欧美很大的市场份额,被花旗、汇丰、Bank of America等多家知名银行应用。』
『美国平均每年会产生约50亿张支票,且欧美国家人力成本普遍偏高,因此他们从90年代就开始大量使用机器进行相关的票据处理了。反观国内的发展,甚至到了今天还有很大一部分企业依然在沿用人工录入信息的方式,更别提10到20年前的中国了。』
爱国情怀这个词,平时说起来或许显得虚无缥缈了些,但当真正身处异国他乡时