Feature Enhancement Network: A Refined Scene Text Detector

本文提出特征增强网络(FEN),结合低维和高维语义特征,提升文本检测性能。通过Feature Enhancement RPN (FE-RPN)和Hyper Feature Generation增强特征,使用adaptively weighted position-sensitive RoI pooling层提高精度,解决样本不平衡问题。FEN在ICDAR 2011和2013检测中表现出色,尤其适用于宽高比变化大的文本检测。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题1、怎么进行特征增强?。。。。

高维度的语义信息利于目标分类,而低维度的语义信息利于对目标进行精确定位?

用3x3的滑窗做region proposal以及在高维度用单一尺度做检测微调是不够的。

FEN:任务特定,低维和高维语义特征融合,从而提高文本检测性能。

adaptively weighted position-sensitive RoI pooling layer:进一步提高检测精度。

positives mining strategy:处理细化阶段的样本不平衡的问题。

效果:在ICDAR 2011 and 2013的检测中,F-measure最高。

文本检测方法粗略分为三种:1、Character-based;2、Word-based本文的方法;3、Text-line-based。

一般的目标检测是2阶段two stages方法:proposals generation and detection refinement
使用ResNet-101 network as backbone network,并且把1、Feature Enhancement RPN (FE-RPN)和2、Hyper Feature Generation 集成到resnet101中。

本文主要是提出了一个特征增强网络来增强文本特征,从而更好的生成proposal和文本refinement。

1、传统只使用3×3滑窗进行区域建议,这里增加了两个卷积方式,加大了网络宽度,并且能增强特征;

2、之前只在高维特征使用单尺度进行文本检测框的精细化,这里使用了特征融合,更精确;

3、由于在一般的目标检测中的单一的position-sensitive RoI pooling在文本区域是不合理的,所以设计了adaptively weighted position-sensitive RoI pooling layer进一步提高检测精度;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值