
场景文本识别
文章平均质量分 92
在这个专栏里将记录很多关于场景文本识别任务的一些任务,包括对抗攻击、文本图像超分辨、文本图像数据增广等等。
fond_dependent
follow your deream,follow your code
展开
-
分析一些流行的行人重识别(RE-identification)的方法和思路
0. 引言Re-ID 作为一个特定的人检索问题,在不重叠的摄像机上被广泛研究。给定一个感兴趣的查询人,重新标识的目标是确定这个人是否在不同的时间出现在另一个地方,由不同的相机拍摄。查询人可以由图像、视频序列甚至文本描述来表示。由于公共安全的迫切需求以及大学校园、主题公园、街道等处监控摄像头数量的不断增加,在智能视频监控系统设计中,人的身份识别势在必行。人员重新识别是指从计算机视觉的角度来看,通过多个监控摄像机的行人检索问题。一般来说,为特定场景构建人员重新标识系统需要五个主要步骤(如图1所示):第一步原创 2020-12-13 22:47:29 · 10277 阅读 · 0 评论 -
GNN中如何利用置信度和不确定性做文章
0. 引言目前图神经网络存在很多的问题,这里作者提出了两个,一个是过平滑,另外一个是对预测结果的不确定性进行评估,换句话说希望预测的结果不仅仅是一个结果,如果有一个置信度就更好了,比如疾病预测,预测了影像目前是什么病,有一个置信度是不是会更有价值一些呢?之前很少有人探讨过GCN背景下的置信度估计,这篇博客将看看仅这些工作是如何做的?1. Confidence-based Graph Convolutional Networks for Semi-Supervised Learning(AISTATS原创 2020-12-01 20:28:17 · 2027 阅读 · 1 评论 -
Exploring Font-independent Features for Scene Text Recognition (ACM2020)研究场景文本中与字体无关的特征
0. 引言1. 摘要近年来,场景文本识别(STR)已得到了广泛的研究。许多最近提出的方法都是经过专门设计的,以适应场景文本的任意形状,布局和方向,但是忽略了各种字体(或书写)样式也给STR带来了严峻挑战。这些方法(使字符的字体特征和内容特征纠缠在一起)在具有新颖字体样式的文本的场景图像上的文本识别中表现不佳。为了解决这个问题,我们通过注意生成大量字体样式的字形来探索场景文本的字体无关特征。具体来说,我们引入可训练的字体嵌入来塑造生成的字形的字体样式,场景文本的图像特征仅代表其基本模式。生成过程以空间注原创 2020-09-25 09:19:43 · 2534 阅读 · 0 评论 -
ECCV 2020 ——RobustScanner: Dynamically Enhancing Positional Clues for Robust Text Recognition
引言摘要基于注意力的编解码框架最近在场景文本识别方面取得了令人瞩目的成果,并且随着识别质量的提高,出现了许多变体。然而,它在无上下文文本(如随机字符序列)上的性能较差,这在大多数实际应用场景中是不可接受的。本文首先深入研究了译码器的解码过程。实验发现,典型的字符级序列译码器不仅利用了上下文信息,而且还利用了位置信息。现有的大量依赖上下文信息的方法导致了注意力漂移的问题。为了抑制注意力漂移带来的副作用,我们提出了一种新的位置增强分支,并将其输出与解码器注意模块的输出动态融合,用于场景文本识别。具体地说,它原创 2020-08-18 21:42:42 · 933 阅读 · 0 评论 -
基于少量标记样本的真实场景中的文本识别(Text Recognition in Real Scenarios)
引言摘要场景文本识别(STR)由于其广泛的应用,一直是计算机视觉领域的研究热点。现有的研究主要集中在学习一个通用的模型,用大量的合成文本图像来识别无约束的场景文本,并取得了实质性的进展。然而,这些方法在许多实际场景中并不十分适用:1)需要较高的识别精度,而2)缺少标记样本。为了解决这一挑战性问题,本文提出了一种在合成源域(具有多个合成标记样本)和一个特定目标域(只有一些或几个真实标记样本)之间建立序列自适应的方法。这是通过一种注意机制同时学习每个字符的特征表示,并通过对抗性学习建立相应的字符级潜在子空间原创 2020-08-17 22:47:45 · 1148 阅读 · 1 评论 -
谈一谈场景文本图片的超分辨
引言文本图像的超分辨任务做的不是很多,有专门针对文本识别的也有针对文本检测的,总而言之,带有文本序列的图像和在imangeNet里的图像是不一样的,那我们来仔细看一看文本图像大家都是怎么做的TextSR: Content-Aware Text Super-Resolution Guided by Recognition(ICML2019)动机现在文本识别技术已经在干净文本图像上取得了令人...原创 2020-04-27 20:17:58 · 5117 阅读 · 5 评论 -
谈一谈在OCR/场景文本识别中的对抗攻击
引言目前对抗攻击在计算机视觉中如火如荼,作为计算机视觉的一个子领域OCR,文本识别和文本检测领域中对抗攻击的任务并不多,其中文本检测可以说是一种目标检测的任务,所以目标检测的攻击方法可以直接应用在文本检测中;文本识别是一种序列分类的任务和很多图像分类任务不同,所以攻击方法不能直接迁移,下面我们对三篇论文来看一看他们的攻击思路。Adaptive Adversarial Attack on Sce...原创 2020-04-22 19:13:21 · 5971 阅读 · 3 评论 -
【文本图像超分辨】Scene Text Image Super-Resolution in the Wild
引言这是一篇最新发出来的论文,看样子要投NIPS2020,这个论文可以看作我以前介绍过的TextSR的升级版,两个作者都是同一个人。这篇论文的主要想法就是提出一个专门用来进行文本超分辨的数据集,并且提出了一个专门用来进行文本超分辨的网络。Scene Text Image Super-Resolution in the Wild摘要分辨率的文本图像通常出现在自然场景中,如手机捕获的文档。识别低分辨率文本图像具有挑战性,因为它们丢失了详细的内容信息,导致识别精度差。一个直观的解决方案是引入超分辨率(SR原创 2020-05-12 22:53:23 · 12071 阅读 · 42 评论