
目标检测
文章平均质量分 87
Lilith_99
不穿格子衫的小白
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
点点的目标检测成长之路
写在前面读研究生了,目前的方向是目标检测(主要在文本检测这一块),本科时候偷的懒作的孽到底还是要还…第一篇博客,记录一下看论文的理解和感悟,暂作自己复习回顾用,理解较浅还请见谅。研究初期看了一篇关于文本检测的综述性博客,https://blog.youkuaiyun.com/SIGAI_优快云/article/details/80858565打算按照博客上面梳理的结构来进行系统化学习。把相关论文下载并...原创 2018-11-04 13:03:10 · 385 阅读 · 1 评论 -
目标检测之模型篇(9)【Inceptext】
文章目录1. 前言2. 具体实现2.1 网络结构2.2 Inception-text模块结构2.3 可变形的卷积2.4 可变形的PSROI池化2.5 Ground Truth与损失函数2.5.1 Ground Truth2.5.2 损失函数3.实验结果3.1 Inceptext和PSROI Pooling的影响3.2 Inceptext模型效果4. 总结5.参考文献1. 前言今天拜读阿里爸爸1...原创 2018-11-21 21:28:42 · 1435 阅读 · 0 评论 -
目标检测之模型篇(7)【SegLink】
文章目录前言前言这篇文章本应放在第五个读,而我查阅资料后临时改变了顺序。因为之前的几篇是two-stage方法,如R-CNN系算法,其主要思路是先通过启发式方法(selective search)或者CNN网络(RPN)产生一系列稀疏的候选框,然后对这些候选框进行分类与回归;而SegLink,Textboxes/Textboxes++都是基于SSD,也就是one-stage方法,如Yolo和S...转载 2018-11-19 16:10:39 · 5959 阅读 · 0 评论 -
目标检测之模型篇(8)【TextBoxes/TextBoxes++】
文章目录1. 前言2. TextBoxes模型3. TextBoxes++模型3.1模型结构3.2 default boxes3.3 调整GT3.4 损失函数3.5 On-line hard negative mining3.6 数据增广3.7 多尺度训练3.8 有效级联NMS3.9 结果4. 总结5. 参考文献1. 前言上篇看到Seglink模型,这次看TextBoxes/TextBoxes...原创 2018-11-19 21:56:07 · 5487 阅读 · 0 评论 -
caffe环境搭建:Ubuntu14.04+Anaconda3+caffe(GPU)
帮师兄作对比实验,决定开始搭建第二个深度学习框架——caffe。讲真,搭环境是最最最最最最虐的事情,会有各种莫名其妙的问题出来,很有可能一卡卡一天。就算是上网查了其他人的搭建步骤,还是坑一堆。1.anaconda配置caffe虚拟环境创建虚拟环境:conda create -n caffe python=2.7激活虚拟环境:source activate caffe安装caffe...原创 2018-11-26 11:33:24 · 546 阅读 · 0 评论 -
ICDAR2013/2015数据集处理:转换成PASCAL_VOC格式
前言做实验down了别人的项目,需要生成tfrecord文件,然而一开始生成了几次都是空文件。联系到了原作者,发现是xml文件生成的有问题了。这个项目需要的是8个点的坐标(矩形四个顶点的x1,y1,x2,y2,x3,y3,x4,y4坐标,顺时针),所以xml文件也是要8个坐标的。我选择的数据集是ICDAR2013和ICDAR2015,其中2013的GT标签是只有4个坐标的(对角线的坐标x1,y...原创 2018-12-01 16:34:55 · 3818 阅读 · 13 评论 -
RRPN/R2CNN实验代码修改记录
修改显卡:cfgs.py文件 第15行 GPU_GROUP=“1”查看显卡使用情况: nvidia-smi生成tfrecord文件:-a: 改cfgs.py第9行 NET_NAME=‘resnet_v1_50’ 作者用的是101第8行 VERSION=‘RRPN_VOCdevkit2007(MLT)_v1’第64行 DATASET_NAME=‘VOCdevkit2007(ML...原创 2019-03-22 22:14:38 · 2309 阅读 · 7 评论 -
PixelLink实验(一)
PixelLink实验项目工程文件下载(SSH key的添加)本周开始进行PixelLink模型的实验,从Github下载了作者的项目工程文件:git clone --recursive git@github.com:ZJULearning/pixel_link.git这里涉及到添加SSH key的问题,之前没有添加所以执行失败。SSH(Secure Shell)是一个允许两台电脑之间通过...原创 2019-03-21 11:37:01 · 1953 阅读 · 16 评论 -
Ubunu14.04安装GPU版本Pytorch(CUDA8.0 cudnn6.0 python2.7)
关注很久的一个模型今天开源,欣喜若狂的clone下来测试一下效果,但是它是基于Pytorch的,之前安装过的是TF和caffe,所以刚好搭一下Pytorch的环境。首先去Pytorch官网,选择配置,这里选择conda安装方式,但是发现它默认给我装的是Python3.7,但是我需要的是Python2.7。所以先用conda创建并激活一个Python2.7的虚拟环境:conda create -...原创 2019-03-29 16:41:36 · 958 阅读 · 0 评论 -
PixelLink实验(二)在弯曲文本数据集上的检测
前言模型复现成功,想看一下PixelLink在弯曲文本数据集上的测试效果,选择CTW-1500和Total-Text数据集。CTW-1500数据集是华南理工大学金连文老师团队提出的针对弯曲文本检测的数据集,包含1000张训练集和500张测试集,每一张图片都至少包含一个弯曲文本行。下载地址:https://pan.baidu.com/s/1eSvpq7o 密码fatf可视化标注地址:http...原创 2019-03-27 19:26:19 · 2466 阅读 · 7 评论 -
CTPN实验(三)PyCharm远程调试
前言每次都需要在服务器上先source activate tensorflow,实在是太没有效率了。而且服务器上也没有个能好好看代码的软件,所以我决定在windows本机使用PyCharm与服务器上的代码同步,来远程开发和调试。PyCharm专业版安装和破解Q:为什么用专业版?A:需要远程调试,这是专业版的功能。如果不需要的话,用社区版就可以了。step1:下载专业版PyCharm官方...原创 2018-11-15 11:03:32 · 367 阅读 · 0 评论 -
CTPN实验(一)环境搭建:Anaconda3+tensorflow(GPU)版本+CUDA8.0+cuDNN6.0
首先,从github将项目克隆到本地。git clone https://github.com/eragonruan/text-detection-ctpn.git放在了~/text-detection-ctpn文件夹里。原创 2018-11-12 20:00:00 · 1612 阅读 · 0 评论 -
目标检测之网络篇(3)【Faster R-CNN】
前言本周目标是看三篇网络类,读到第三篇Faster R-CNN的时候我发现需要先弄懂R-CNN以及Fast R-CNN。引用@v_JULY_v的文章的总结:RCNN1.在图像中确定约1000-2000个候选框 (使用选择性搜索Selective Search)2.每个候选框内图像块缩放至相同大小,并输入到CNN内进行特征提取3.对候选框中提取出的特征,使用分类器判别是否属于一个特定类4...转载 2018-11-04 13:02:42 · 1146 阅读 · 0 评论 -
目标检测之网络篇(2)【STN-空间变换网络】
文章目录1. STN是什么2. 问题的提出——CNN的平移不变性3. STN基本结构3.1 Localisation network(参数预测)3.2 Grid generator(坐标映射)3.3 Sampler(像素采集)4. 总结5. 参考文献1. STN是什么STN:Spatial Transformer Networks,即空间变换网络,是Google旗下 DeepMind 公司的研...原创 2018-11-04 13:02:51 · 3953 阅读 · 2 评论 -
目标检测之模型篇(1)【CTPN连接文本提议网络】
文章目录1. 前言2. 实现2.1 关键idea2.2 模型结构2.3 具体细节1.检测小尺度文本框(Detecting Text in Fine-scale Proposals)2.循环连接文本框(Recurrent Connectionist Text Proposals)3.文本行边细化(Side-refinement)3. 训练1.训练标签labels2.训练成本loss3.训练参数4. ...原创 2018-11-04 13:02:24 · 1856 阅读 · 1 评论 -
目标检测之模型篇(3)【DMPNet】
文章目录1. 前言2. 实现2.1 Roughly recall text with quadrilateral sliding window2.2 Finely localize text with quadrangle2.3 Smooth Ln loss3. 结果4. 总结与思考5. 参考资料1. 前言本周第三篇模型文章,读的是我工电信院大佬发的paper,莫名亲切感~DMPNet全...原创 2018-11-06 16:17:01 · 4056 阅读 · 4 评论 -
目标检测之模型篇(4)【EAST】
文章目录1. 前言2. 实现3. 结果4. 总结5. 参考资料1. 前言这篇文章是我最早读的模型类文章,但是当时还没萌生出写博客复习总结的想法。还好这个想法出现的不晚,现在是第四篇模型类文章,刚好拿来复习一下。当时读的时候就觉得作者字里行间充满了自信(可能是因为EAST模型的效果真的很好吧),EAST这名字又有种东方的神秘气息(误),话不多说,还是开始介绍吧。EAST全名an Efficie...原创 2018-11-07 10:49:42 · 9200 阅读 · 2 评论 -
目标检测之模型篇(5)【PixelLink】
文章目录1. 前言2. 实现2.1 网络结构2.2 将像素连接到一起2.3 边界框的提取2.4 分割之后的后处理(滤波)3. 优化4. 结果5. 总结6. 参考文献1. 前言高产似母猪的一周,这是第五篇模型阅读。同时纪念今天实验室可以连IPv6啦撒花!可以不用费心巴力去找Ubuntu翻墙的方法了开心!Google账户都同步了!!言归正传,PixelLink是基于分割来检测场景文本,与之前的4...转载 2018-11-07 19:40:49 · 1798 阅读 · 0 评论 -
目标检测之模型篇(2)【RRPN】
文章目录1. 前言2. 实现2.1 关键idea2.2 模型结构2.3 具体细节1.Rotated Bounding Box Representation-旋转矩形框的表示2.Rotation Anchors-旋转角度3.Learning of Rotated Proposal-旋转矩形候选框的学习4.Accurate Proposal Refinement Skew-准确候选框的修正5.RRoI...原创 2018-11-05 10:37:30 · 11372 阅读 · 8 评论 -
CTPN实验(二)运行例程demo_pb.py
step1:再在服务器上下载一次CTPN包。链接传送门step2:从release里下载ctpn.pb,并放入text-detection-ctpn/data/文件夹里step3:从google drive或百度网盘下载VGG预训练模型和训练集。step4:选择使用GPU:cd text-detection-ctpn/lib/utilschmod +x make.sh./make....原创 2018-11-13 11:34:16 · 1892 阅读 · 4 评论 -
目标检测之模型篇(6)【RARE】
文章目录1. 前言2. 实现2.1 STN2.1.1 定位网络2.1.2 网格生成器2.1.3 采样器2.2 SRN2.2.1 编码:卷积循环网络2.2.2 解码:循环字符生成器2.3 训练3. 测试3.1 STN网络:3.2 STN网络:3.3 模型训练:3.4 实现:4. 总结5. 参考文献1. 前言在读Abstract的时候我觉得这篇文章挺有趣、挺创新的,本文的方法加入了STN变形矫正,...翻译 2018-11-08 11:34:48 · 6563 阅读 · 3 评论 -
批量处理total-text数据集格式
total-text数据集的格式不同于CTW-1500和ICDAR家族,后者是直接以坐标的形式存放在.txt文件中的,而total-text的标注格式长这样,取其中一张图的GT为例:x: [[115 503 494 115]], y: [[322 346 426 404]], ornt: [u'm'], transcriptions: [u'nauGHTY']x: [[734 1058 106...原创 2019-07-23 17:13:27 · 6187 阅读 · 8 评论