
cvPaper
文章平均质量分 80
weixin_43751285
这个作者很懒,什么都没留下…
展开
-
文字检测识别综述
本文分析、比较和对比了彩色图像中文本检测和识别研究的技术挑战、方法和性能。 它总结了基本问题,并列举了在处理这些问题时应考虑的因素。 现有的技术被归类为分步的或集成的,并突出显示子问题,包括文本定位、验证、分割和识别。 还讨论了与加强退化文本和处理视频文本有关的特殊问题,多面向、透视扭曲和多语种文本。 说明文本的类别和子类别,列举基准数据集,并比较最具代表性的方法的性能。 本次审查对实地遗留问题进行了根本性的比较和分析。 造成这一趋势的几个主要原因,包括越来越多的应用程序的需求。 文本是最具表现力的传播手段原创 2021-01-15 21:57:56 · 1274 阅读 · 0 评论 -
Scene Text Detection and Recognition
基于早期深度学习的方法(Huang et al.,2014;Tian et al.,2015;Yao et al.,2016;Zhang et al.,2016;He et al.,2017a)将文本检测任务分为多个步骤。他们使用卷积神经网络(CNNs)来预测局部片段,然后应用启发式后处理步骤将片段合并到检测线中。 在早期的尝试中(Huang等人,2014年),CNN只用于将局部图像patch分类为文本类和非文本类。 使用MSER特性来分离的图像patch。 然后将正patch合并到文本行中。 之后,CNN原创 2021-01-05 21:41:57 · 281 阅读 · 0 评论 -
Character Region Awareness for Text Detection(2)
4 方法论 我们的主要目标是在自然图像中精确定位每个字符。为此,我们训练了一个深层神经网络来预测字符区域和字符之间的亲和力。由于没有公共字符级的数据集,所以采用弱监督的方式对模型进行训练。 // 这一段讲了craft需要实现的目标,和实现目标的方法:神经网络输出字符区域概率和字符间距概率。没有字符集别的数据集,通过弱监督训练而成。 4.1 体系结构 我们的主干网采用基于VGG-16的全卷积网络体系结构。我们的模型在解码部分与编码部分有拼接,这与U-net相似,因为它聚集了低水平的特征。最终输出有两个通道作为原创 2020-12-16 12:48:43 · 287 阅读 · 1 评论 -
Character Region Awareness for Text Detection(1)
文本检测算法:CRAFT 一、摘要 基于神经网络的场景文本检测方法近来才出现并在文本检测中取得很好的结果。过去的神经网络使用(world-level)以单词为边界数据集训练算法。使用该方法训练后的模型在检测任意形状表示的文本区域存在一定的缺陷。本文提取了一种新的场景文本检测方法,通过字符之间的亲和力(affinity)来有效的检测文本区域。 为了克服缺少单个字符级注释问题,我们提出的框架即利用了合成图像的字符集注释还通过合成图像训练出模型检测出的真实图像的预估字符。为了估计字符之间的亲和力,使用新提出的亲和原创 2020-12-11 13:16:57 · 202 阅读 · 0 评论