
论文阅读
文章平均质量分 92
Weijin_
这个作者很懒,什么都没留下…
展开
-
【论文阅读】A Multiplexed Network for End-to-End, Multilingual OCR
[2021-03-arXiv] A Multiplexed Network for End-to-End, Multilingual OCR端到端、多语言OCR的多路网络Introduction现有的许多方法主要集中在拉丁字母语言上,甚至往往只关注于不区分大小写的英语字符。在本文中,提出了一种端到端的多语种text spotter。具体来讲,本文提出了一个单独的文本检测模块,和多个针对每种语言的文本识别头,由多路复用器将检测到的文本送到适当的头,由语言预测模型(Language Prediction原创 2021-04-08 16:39:43 · 1006 阅读 · 0 评论 -
【论文阅读】Not All Attention Is Needed: Gated Attention Network for Sequence Data
[2020-AAAI] Not All Attention Is Needed: Gated Attention Network for Sequence DataAbstract传统的注意机制一般是全局的,它注意到句子中所有的单词,但有些注意权重可能很小。然而,通过对几个自然语言处理任务的研究,我们发现只有一小部分输入与输出目标相关。这也与我们的直觉一致,即不是所有的注意力都需要,特别是对于长序列。在不相关的元素上计算注意力权重是多余的。不仅如此,由于注意机制给每个输入单元分配了一个权重,即使是不相关原创 2021-03-30 16:41:40 · 862 阅读 · 0 评论 -
【论文阅读】Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for STR
[2021-CVPR] Read Like Humans: Autonomous, Bidirectional and Iterative Language Modeling for Scene Text Recognitionpaper: arxiv.org/abs/2103.06495code: https://github.com/FangShancheng/ABINetIntroduction本文提出了一种将语言知识应用于场景文本识别的有效方法——ABINet。ABINet的三个主要特点就是原创 2021-03-21 15:53:17 · 2864 阅读 · 1 评论 -
【论文阅读】Semi-supervised Scene Text Recognition
[2021-TIP] Semi-supervised Scene Text RecognitionAbstract本文提出了一种新的半监督场景文本识别方法。具体来说,我们设计了编辑奖励和嵌入奖励两个全局指标来评估生成的字符串的质量,并采用强化学习技术直接优化这些奖励。Contributions提出了一种新的半监督场景文本识别方法,该方法可以利用大量的未标记数据来提高识别性能。设计了两个全局指标作为强化学习的优化目标。编辑奖励可以衡量ground truth和生成字符串之间的一致性,而嵌入奖励可以原创 2021-03-11 23:33:02 · 518 阅读 · 0 评论 -
【论文阅读】SLOAN: Scale-Adaptive Orientation Attention Network for Scene Text Recognition
[2021-TIP] SLOAN: Scale-Adaptive Orientation Attention Network for Scene Text Recognition原文链接:linkAbstract现有的识别方法致力于处理几何规则或不规则的场景文本。它们局限于语义取向任意的场景文本。同时,以往的场景文本识别器通常学习不同尺度字符的单尺度特征表示,不能对不同字符的有效上下文进行建模。本文提出了一种基于尺度自适应的任意方向场景文本识别定向注意网络,包括a dynamic log-pola原创 2021-03-04 19:10:04 · 566 阅读 · 2 评论