【自然场景文本检测】PSENet: Shape Robust Text Detection with Progressive Scale Expansion Network...

本文详细介绍了PSENet,一种用于精确文本检测的深度学习算法。该算法通过学习不同尺度的文字区域,实现了从粗到细的文本边界检测,提高了检测精度。文章提供了GitHub项目链接及论文资源,便于读者深入研究。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

github:https://github.com/whai362/PSENet

论文:https://arxiv.org/abs/1806.02559

 

 主要思想:

网络主要学习,Sn,Sn-1,.......,S1, 其中Sn占文字区域100%, Sn-1占文字区域90%,...........S1占文字区域50%

标签可以利用clipper来实现

 

后期处理:先求联通区域,即很多个S1,再利用S1作为文字区域核在S2中进行膨胀,依次进行,最后到Sn

例如:当n=4,Sn的预测可以如下表示

F_score = slim.conv2d(F, 4, 1, activation_fn=tf.nn.sigmoid, normalizer_fn=None)

天池检测结果

 


 

转载于:https://www.cnblogs.com/linyuanzhou/p/10199730.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值