2020 Radical analysis network for learning hierarchies of Chinese characters学习

本文介绍了一种名为RAN的新型汉字识别算法,它利用字根分析网络和注意力机制,有效提取汉字字根及字形特征,实现了自然场景下汉字的高效识别。RAN在MTWI2018竞赛中夺冠,展示了其在中文识别领域的优势。

Abstract

汉字是宝贵的财产,在于其由基础字根库和结构化的字形构成了庞大的汉字数量。本文引入RAN(radical analysis network自由基分析网络或字根分析网络)充分利用上述特征来实现汉字的识别。RAN使用注意力机制实现汉字字根的提取和字根间的空间结构特征(字形特征)。然后RAN解码出包含已提取字根和字形特征的汉字层次结构。把汉字看做由字根构成比把每个汉字看成一个整体更受人们欢迎,因为它既能大大降低词汇量,还能忽视形近字的冗余信息,并且使得系统能识别未见过的字,例如零基础学习。文中介绍的方法获得了自然场景文本行识别竞赛MTWI 2018的冠军,突出了该算法较基于整字建模的中文识别算法的优势。通过实验,我们评估RAN在自然场景的的实际表现,此外,新增denseRNN编码器,多注意力机制和HSV表示的RAN可用于场景文本识别。

评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值