文章目录
Towards Accurate Scene Text Recognition with Semantic Resoning Networks
基本信息
- 论文链接:arxiv
- 发表时间:2021 - CVPR
- 应用场景:场景文字识别
摘要
| 存在什么问题 | 解决了什么问题 |
|---|---|
| 1. 之前的场景文字识别模型在视觉信息上的挖掘是比较充分的,但是对于语义信息的使用考虑较少。 2. 过往的模型中用到语义信息的大都使用了RNN结构,但是它有着天然的缺陷:不能并行解码、并且其上下文语义是单路的(要么来自于上一个字符,要么来自于下一个字符),限制了计算效率与信息的有效传播、这期间还会有无用语义信息以及错误语义信息的传播,效果不尽如人意。 |
1. 提出了SRN网络,该网络中的GSRM模块能够将全局语义信息通过多路并行传播,进而对上下文语义进行充分的探索,使得SRN在regular以及irregular dataset上达到多个SOTA。 |
模型结构

label预处理规则:头部加 < s o s > <sos> <sos>,尾部加 < e o s > <eos> <

最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



