【总结】以Faster R-CNN为基础:
①使用区域建议生成网络RPN生成包围文本的水平边界框;
② 对预测出的每一个水平边界框,提取其不同池化尺寸的池化特征,同时利用聚合特征预测文本/非文本得分、水平边界框和最小倾斜框;
③利用倾斜非极大值抑制NMS获得最终结果。

一、引言
主要成果:
- 引入了一个新的用于任意方向场景文本的检测框架。RPN用于生成水平候选框,改进后的Fast R-CNN用于分类和倾斜框的预测优化;
- 将任意方向的文本检测转化为一个多任务问题。该方法的核心是对文本得分、水平框和最小倾斜框的预测;
- 为了充分利用文本特征,对每个RPN候选框进行了多个尺寸的ROI池化,然后连接特征用于检测;
- 在Faster R-CNN的基础上增加了一

该研究提出了一种基于Faster R-CNN的新型文本检测框架,用于任意方向的场景文本。通过区域建议网络RPN生成水平候选框,结合多尺寸的ROI池化提取特征,并预测文本得分、水平和倾斜边界框。采用倾斜非极大值抑制NMS优化结果,特别针对小文本检测增加了小尺寸的anchor。该方法将文本检测转化为多任务问题,有效提高了任意方向文本的检测能力。
最低0.47元/天 解锁文章
4117

被折叠的 条评论
为什么被折叠?



