CRNN骨干网络替换指南

CRNN骨干网络替换指南

CRNN自2015年发表至今,仍然是OCR领域霸榜的存在。但当时所用的骨干网络直接早已落后于现在的AUTOML搜索,比如:mobilenetv3,efficientnet。如何将这些新型网络应用于CRNN呢,掌握本博客介绍的原则,轻松替换你的CRNN骨干网络。



前言

修改CRNN骨干网络前,需要具备一个常识,自Vgg网络开始,所有的特性提取网络都有以下两个步骤:

1、5次下采样。
2、flatten、pooling、linear等操作输出最终类别

拿经典的Resnet为例,输入尺寸224×224,经过5次下采样缩减为7×7(224/32)特征图 ,最后经过AdaptiveAvgPool2d、linear操作输出最终类别


一、CRNN的骨干网络设计

首先看CRNN的骨干网络设计:
crnn网络结构
如图所示,模型输入为32×320的图像,输出为1×81的特征图,其中高度部分一共下采样5次(5个红色框),宽度部分只在前两次进行下采样(2个绿色框)。

基于此设计准则,我们就可以愉快地修改我们自己的CRNN特征提取网络了,我们要做的就是将所选的骨干网络,
1、倒数后3次的stride由2改为(2,1)
2、删除采样后面的pooling、linear等操作

二、实战部分

1. 基于mobilenetv3的CRNN

mobilenetv3没有官网实现,高星实现: mobilenetv3为基础模型。
如下图红框部分所示,将倒数3个s 由2改为(2,1)

评论 4
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值