
文字检测+识别
wzw12315
这个作者很懒,什么都没留下…
展开
-
使用pytorch实现crnn
改动点:(1)把传统的卷积改造成深度可分离卷积;(2)使用pytorch实现的ctc,不再使用百度开源的warpctc,主要原因是本人使用Windows来开发调试,编译warpctc貌似很麻烦;crnn网络实现代码:class BidirectionalLSTM(nn.Module): def __init__(self, nInput_size, nHidden,nOut): super(BidirectionalLSTM, self).__init__(.原创 2020-06-09 15:33:48 · 7809 阅读 · 10 评论 -
使用 深度可分离卷积(Depthwise Separable Convolution) 改造CRNN网络
深度可分离卷积(Depthwise Separable Convolution)能够使得网络的参数大幅度减少,本文拟在改造CRNN,看看参数量的变化情况:改造前crnn网络的cnn部分网络代码:class CNN0(nn.Module): def __init__(self,imageHeight,nChannel): super(CNN0,self).__init__() assert imageHeight % 32 == 0,'image Heigh原创 2020-06-08 16:13:52 · 911 阅读 · 1 评论 -
from scratch implement crnn using pytorch :读取训练数据
知识点: torch.nn.ReLU(inplace=True)中inplace的作用 在文档中解释是:参数: inplace-选择是否进行覆盖运算意思是是否将得到的值计算得到的值覆盖之前的值,比如:x = x +1即对原值进行操作,然后将得到的值又直接复制到该值中而不是覆盖运算的例子如:y = x + 1x = y这样就需要花费内存去多存储一个变量y,所以nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=原创 2020-05-15 17:16:23 · 502 阅读 · 0 评论 -
MSRA-TD5000数据集使用
中文检测的数据集:清华的CTW,https://ctwdataset.github.io/但是数据集只存储在微云和google driver,微云空间受限不能完全保存,下载很麻烦华科的MSRA TD5000,支持中英文的倾斜文本检测http://www.iapr-tc11.org/mediawiki/index.php/MSRA_Text_Detection_500_Databas...原创 2020-04-30 10:02:01 · 1005 阅读 · 0 评论 -
setup.py setup_cpu.py setup_gpu.py
关于rcnn变形算法中setup.py文件的一些出坑指南https://zhuanlan.zhihu.com/p/114487124原创 2020-04-17 14:24:54 · 197 阅读 · 0 评论 -
文字检测篇-传统篇
文字检测是文字识别过程中的一个非常重要的环节,文字检测的主要目标是将图片中的文字区域位置检测出来,以便于进行后面的文字识别,只有找到了文本所在区域,才能对其内容进行识别。 文字检测的场景主要分为两种,一种是简单场景,另一种是复杂场景。其中,简单场景的文字检测较为简单,例如像书本扫描、屏幕截图、或者清晰度高、规整的照片等;而复杂场景,主要是指自然场景,情况比较复杂,例如...原创 2020-05-27 16:32:32 · 5365 阅读 · 0 评论