疫情防控常态化下,学校为了保证孩子身体健康和安全,要求所有入校人员提供通信行程码并审核。但是通过人工审核的方式,不仅工作量极大且容易出错。作为一名软件开发工程师,我开始思考并着手调研,希望可以通过更智能的方式来解决。
在调研过程中,发现腾讯云AI文字识别产品推出了健康码OCR、行程卡OCR等多种自动化识别能力,刚好契合智能识别这个现实问题。但是识别出来的结果是否准确呢?
查阅了官方介绍资料,发现腾讯云AI联合腾讯优图实验室针对文本检测和文字识别关键技术进行了优化和创新。在文本检测技术方面进行了深度优化,提出了Compact Inception,通过设计合理的网络结构来提升各尺度的文字检测/提取能力。同时引入RNN多层自适应网络和Refinement结构来提升检测完整性和准确性。
在文本识别方面,经过大量实验和实践,对主流CNN+RNN+CTC方法进行了改进和创新:对CNN加入了横向非对称卷积和综合多种尺度感受野的特征,增强了网络对多尺度字体的支持。对RNN加入了Attention机制,Attention机制的加入,可以在所有特征块的基础上,得到每一个特征块在全局中的权重信息,有效提升整行识别的准确率。这无疑给我们吃了定心丸,放心的采用腾讯云AI文字识别的自动化识别能力了。
根据产品能力介绍,通信行程卡识别能力,可以自动识别出行程卡颜色、途经地、存在中高风险地区的城市、电话号码等信息,实现了全自动的模式,极大的减轻了人工审核的工作量。
接下来,我将详细讲述我是如何使用通信行程卡识别能力。