
深度学习
文章平均质量分 82
Lilith_99
不穿格子衫的小白
展开
-
目标检测之网络篇(1)【FCN-全卷积网络】
前言第一篇论文题目为《Fully Convolutional Networks for Semantic Segmentation》,该文章是是全卷积网络用于图像分割的开山之作,提出将传统卷积神经网络的全连接层转化成卷积层,并使用反卷积上采样恢复原图大小。相比于CNN,FCN可以接受任意大小的图像,且更加高效。首先,梳理一下CNN的相关知识。CNN-卷积神经网络1.神经网络神经网络结构分...原创 2018-11-04 13:03:01 · 2863 阅读 · 0 评论 -
CTPN实验(三)PyCharm远程调试
前言每次都需要在服务器上先source activate tensorflow,实在是太没有效率了。而且服务器上也没有个能好好看代码的软件,所以我决定在windows本机使用PyCharm与服务器上的代码同步,来远程开发和调试。PyCharm专业版安装和破解Q:为什么用专业版?A:需要远程调试,这是专业版的功能。如果不需要的话,用社区版就可以了。step1:下载专业版PyCharm官方...原创 2018-11-15 11:03:32 · 360 阅读 · 0 评论 -
目标检测之模型篇(9)【Inceptext】
文章目录1. 前言2. 具体实现2.1 网络结构2.2 Inception-text模块结构2.3 可变形的卷积2.4 可变形的PSROI池化2.5 Ground Truth与损失函数2.5.1 Ground Truth2.5.2 损失函数3.实验结果3.1 Inceptext和PSROI Pooling的影响3.2 Inceptext模型效果4. 总结5.参考文献1. 前言今天拜读阿里爸爸1...原创 2018-11-21 21:28:42 · 1408 阅读 · 0 评论 -
目标检测之模型篇(7)【SegLink】
文章目录前言前言这篇文章本应放在第五个读,而我查阅资料后临时改变了顺序。因为之前的几篇是two-stage方法,如R-CNN系算法,其主要思路是先通过启发式方法(selective search)或者CNN网络(RPN)产生一系列稀疏的候选框,然后对这些候选框进行分类与回归;而SegLink,Textboxes/Textboxes++都是基于SSD,也就是one-stage方法,如Yolo和S...转载 2018-11-19 16:10:39 · 5890 阅读 · 0 评论 -
目标检测之模型篇(8)【TextBoxes/TextBoxes++】
文章目录1. 前言2. TextBoxes模型3. TextBoxes++模型3.1模型结构3.2 default boxes3.3 调整GT3.4 损失函数3.5 On-line hard negative mining3.6 数据增广3.7 多尺度训练3.8 有效级联NMS3.9 结果4. 总结5. 参考文献1. 前言上篇看到Seglink模型,这次看TextBoxes/TextBoxes...原创 2018-11-19 21:56:07 · 5459 阅读 · 0 评论 -
caffe环境搭建:Ubuntu14.04+Anaconda3+caffe(GPU)
帮师兄作对比实验,决定开始搭建第二个深度学习框架——caffe。讲真,搭环境是最最最最最最虐的事情,会有各种莫名其妙的问题出来,很有可能一卡卡一天。就算是上网查了其他人的搭建步骤,还是坑一堆。1.anaconda配置caffe虚拟环境创建虚拟环境:conda create -n caffe python=2.7激活虚拟环境:source activate caffe安装caffe...原创 2018-11-26 11:33:24 · 532 阅读 · 0 评论 -
caffe出现protoc版本不对的解决方法:
1. 代码下载首先将代码克隆到本地:git clone https://github.com/mjq11302010044/RRPN.git然后cd到lib文件夹,构建Cython模块:cd ~/RRPN/libmake再cd到caffe-fast-rcnn文件夹:cd ~/RRPN/caffe-fast-rcnnmake -j4 && make pycaffe...原创 2018-11-27 14:52:51 · 3776 阅读 · 2 评论 -
ICDAR2013/2015数据集处理:转换成PASCAL_VOC格式
前言做实验down了别人的项目,需要生成tfrecord文件,然而一开始生成了几次都是空文件。联系到了原作者,发现是xml文件生成的有问题了。这个项目需要的是8个点的坐标(矩形四个顶点的x1,y1,x2,y2,x3,y3,x4,y4坐标,顺时针),所以xml文件也是要8个坐标的。我选择的数据集是ICDAR2013和ICDAR2015,其中2013的GT标签是只有4个坐标的(对角线的坐标x1,y...原创 2018-12-01 16:34:55 · 3795 阅读 · 13 评论 -
PixelLink实验(一)
PixelLink实验项目工程文件下载(SSH key的添加)本周开始进行PixelLink模型的实验,从Github下载了作者的项目工程文件:git clone --recursive git@github.com:ZJULearning/pixel_link.git这里涉及到添加SSH key的问题,之前没有添加所以执行失败。SSH(Secure Shell)是一个允许两台电脑之间通过...原创 2019-03-21 11:37:01 · 1936 阅读 · 16 评论 -
Ubunu14.04安装GPU版本Pytorch(CUDA8.0 cudnn6.0 python2.7)
关注很久的一个模型今天开源,欣喜若狂的clone下来测试一下效果,但是它是基于Pytorch的,之前安装过的是TF和caffe,所以刚好搭一下Pytorch的环境。首先去Pytorch官网,选择配置,这里选择conda安装方式,但是发现它默认给我装的是Python3.7,但是我需要的是Python2.7。所以先用conda创建并激活一个Python2.7的虚拟环境:conda create -...原创 2019-03-29 16:41:36 · 951 阅读 · 0 评论 -
CTPN实验(一)环境搭建:Anaconda3+tensorflow(GPU)版本+CUDA8.0+cuDNN6.0
首先,从github将项目克隆到本地。git clone https://github.com/eragonruan/text-detection-ctpn.git放在了~/text-detection-ctpn文件夹里。原创 2018-11-12 20:00:00 · 1596 阅读 · 0 评论 -
Ubuntu18.04环境下成功安装Anaconda3及Tensorflow(CPU)
懒得看论文了,打算从今天开始做实验,先从CTPN的实现开始。找到了在Tensorflow实现的源码,但是需要安装很多依赖:python2.7, tensorflow1.3, cython0.24, opencv-python, easydict,(recommend to install Anaconda)既然作者说了建议装Anaconda,那就装一个咯。之前下载过安装包,但是装错了地方...原创 2018-11-08 19:29:09 · 4742 阅读 · 0 评论 -
目标检测之网络篇(3)【Faster R-CNN】
前言本周目标是看三篇网络类,读到第三篇Faster R-CNN的时候我发现需要先弄懂R-CNN以及Fast R-CNN。引用@v_JULY_v的文章的总结:RCNN1.在图像中确定约1000-2000个候选框 (使用选择性搜索Selective Search)2.每个候选框内图像块缩放至相同大小,并输入到CNN内进行特征提取3.对候选框中提取出的特征,使用分类器判别是否属于一个特定类4...转载 2018-11-04 13:02:42 · 1132 阅读 · 0 评论 -
目标检测之网络篇(2)【STN-空间变换网络】
文章目录1. STN是什么2. 问题的提出——CNN的平移不变性3. STN基本结构3.1 Localisation network(参数预测)3.2 Grid generator(坐标映射)3.3 Sampler(像素采集)4. 总结5. 参考文献1. STN是什么STN:Spatial Transformer Networks,即空间变换网络,是Google旗下 DeepMind 公司的研...原创 2018-11-04 13:02:51 · 3925 阅读 · 2 评论 -
目标检测之模型篇(1)【CTPN连接文本提议网络】
文章目录1. 前言2. 实现2.1 关键idea2.2 模型结构2.3 具体细节1.检测小尺度文本框(Detecting Text in Fine-scale Proposals)2.循环连接文本框(Recurrent Connectionist Text Proposals)3.文本行边细化(Side-refinement)3. 训练1.训练标签labels2.训练成本loss3.训练参数4. ...原创 2018-11-04 13:02:24 · 1814 阅读 · 1 评论 -
目标检测之模型篇(3)【DMPNet】
文章目录1. 前言2. 实现2.1 Roughly recall text with quadrilateral sliding window2.2 Finely localize text with quadrangle2.3 Smooth Ln loss3. 结果4. 总结与思考5. 参考资料1. 前言本周第三篇模型文章,读的是我工电信院大佬发的paper,莫名亲切感~DMPNet全...原创 2018-11-06 16:17:01 · 4026 阅读 · 4 评论 -
目标检测之模型篇(4)【EAST】
文章目录1. 前言2. 实现3. 结果4. 总结5. 参考资料1. 前言这篇文章是我最早读的模型类文章,但是当时还没萌生出写博客复习总结的想法。还好这个想法出现的不晚,现在是第四篇模型类文章,刚好拿来复习一下。当时读的时候就觉得作者字里行间充满了自信(可能是因为EAST模型的效果真的很好吧),EAST这名字又有种东方的神秘气息(误),话不多说,还是开始介绍吧。EAST全名an Efficie...原创 2018-11-07 10:49:42 · 9132 阅读 · 2 评论 -
目标检测之模型篇(5)【PixelLink】
文章目录1. 前言2. 实现2.1 网络结构2.2 将像素连接到一起2.3 边界框的提取2.4 分割之后的后处理(滤波)3. 优化4. 结果5. 总结6. 参考文献1. 前言高产似母猪的一周,这是第五篇模型阅读。同时纪念今天实验室可以连IPv6啦撒花!可以不用费心巴力去找Ubuntu翻墙的方法了开心!Google账户都同步了!!言归正传,PixelLink是基于分割来检测场景文本,与之前的4...转载 2018-11-07 19:40:49 · 1775 阅读 · 0 评论 -
目标检测之模型篇(2)【RRPN】
文章目录1. 前言2. 实现2.1 关键idea2.2 模型结构2.3 具体细节1.Rotated Bounding Box Representation-旋转矩形框的表示2.Rotation Anchors-旋转角度3.Learning of Rotated Proposal-旋转矩形候选框的学习4.Accurate Proposal Refinement Skew-准确候选框的修正5.RRoI...原创 2018-11-05 10:37:30 · 11327 阅读 · 8 评论 -
CTPN实验(二)运行例程demo_pb.py
step1:再在服务器上下载一次CTPN包。链接传送门step2:从release里下载ctpn.pb,并放入text-detection-ctpn/data/文件夹里step3:从google drive或百度网盘下载VGG预训练模型和训练集。step4:选择使用GPU:cd text-detection-ctpn/lib/utilschmod +x make.sh./make....原创 2018-11-13 11:34:16 · 1876 阅读 · 4 评论 -
目标检测之模型篇(6)【RARE】
文章目录1. 前言2. 实现2.1 STN2.1.1 定位网络2.1.2 网格生成器2.1.3 采样器2.2 SRN2.2.1 编码:卷积循环网络2.2.2 解码:循环字符生成器2.3 训练3. 测试3.1 STN网络:3.2 STN网络:3.3 模型训练:3.4 实现:4. 总结5. 参考文献1. 前言在读Abstract的时候我觉得这篇文章挺有趣、挺创新的,本文的方法加入了STN变形矫正,...翻译 2018-11-08 11:34:48 · 6527 阅读 · 3 评论 -
PixelLink实验(二)在弯曲文本数据集上的检测
前言模型复现成功,想看一下PixelLink在弯曲文本数据集上的测试效果,选择CTW-1500和Total-Text数据集。CTW-1500数据集是华南理工大学金连文老师团队提出的针对弯曲文本检测的数据集,包含1000张训练集和500张测试集,每一张图片都至少包含一个弯曲文本行。下载地址:https://pan.baidu.com/s/1eSvpq7o 密码fatf可视化标注地址:http...原创 2019-03-27 19:26:19 · 2425 阅读 · 7 评论