- 博客(11)
- 收藏
- 关注
原创 EAST-tensorflow 源码解读
EAST网络提供了对自然场景中文字区域的目标检测功能源码:https://github.com/argman/EAST主要侧重于对样本标签的制作部分目录一、网络结构二、loss定义三、训练标签的生成3.1 crop_area图片切割3.2 generate_rbox标签生成一、网络结构网络结构不难理解,如下图所示:为了检测不同大小尺度的文字目标,网络...
2019-03-03 11:37:43
4425
2
转载 图像处理CV/ML/DL 面试题整理 (三)
该部分贴一些原博主的关于CV和图像相关的题目三、图像处理(1)opencv遍历像素的方式?1.使用at<dtype>(ij)[c]来访问2.使用ptr<dtpye>(col)[c]来访问,若图像存储连续,可以直接展开成一行来应用指针遍历3.使用迭代器begin<dtype>, end<dtype>来访问,用法与指针一样(2)L...
2018-12-18 17:20:02
2042
转载 图像处理CV/ML/DL 面试题整理 (二)
继续上一篇文章,这篇主要记录原博主的关于深度学习部分的试题二、深度学习部分(1)MLP的BP过程?delta的意义?每一层节点的残差?MLP的BP过程:分别是第j层和第k层输出,是第j层和第k层间的传递矩阵,是k层的输出真值,是第k层误差。那么E对W的导数,即W的优化梯度方向:显然导数并不易求,因此做一下变换:这里又考虑到sigmoid函数的导数为:带入...
2018-12-14 01:43:30
1512
转载 图像处理CV/ML/DL 面试题整理(一)
最近看到了一篇很不错的博客,里面列了一些面试问题汇总,但是排版比较不容易看,而且原作者没有提供完整的答案,在此就基于原作者的思路,完善一下其内容。原博客地址:https://blog.youkuaiyun.com/meyh0x5vDTk48P2/article/details/79179164原作者的文章将文章分为三个部分,分别是机器学习,深度学习,opencv相关。一、机器学习方面(1...
2018-12-13 17:55:02
2361
原创 图像语义分割-----SegNet学习笔记+tensorflow
SegNet网络是一个像素级的语义分割模型,即会针对图像中的每一个像素,对每一个像素进行分类,去识别该像素属于的类别,整个网络分为4层下采样以及4层上采样,最后将一个[W, H, 3]的输入图像处理成[W, H, NUM_CLASSES]的向量,再通过softmax进行分类,转化为[W, H, 1]的张量,再对属于不同种类的像素分别涂上不同的颜色,从新变成[W, H, 3]的图像,但是其中的物体以...
2018-12-12 18:35:07
6012
11
原创 SSD-目标检测代码解读
最近看了SSD的源代码,理了一下其中的逻辑,写一篇学习笔记。代码地址:https://github.com/balancap/SSD-Tensorflow一、网络结构首先贴出来网络结构图,便于后续的分析,这里的图是SSD 300的结构图,而我看的代码是SSD 512,但是思想差别不大,可以看出来SSD比YOLO的差别就是,不仅在最后一层提取预选框,而是在中间某几层就已经开始通过3X3的...
2018-11-22 20:46:41
4909
9
原创 二值图像的连接域标记实现
本文是在借鉴了https://www.cnblogs.com/ronny/p/img_aly_01.html这篇文章之后,对连接域标记进行了实现,原作者是在cpp下完成的,为了方便,我用python实现一下并做一些记录。一、实现原理这里选择基于行程的标记,以下图为例,这里借用原文章中的图片:1、首先,我们自左向右,自上向下的遍历图片,以[start, end]这种形式记录白色块的起...
2018-11-21 18:51:00
752
原创 YOLO学习笔记-样本加载及编码
上一篇简单记录了一下yolo网络的结构,LOSS定义,train方式这三部分,这一篇主要记录一下样本的加载与编码过程,方便加载自己的样本。在开始之前先提一下pascal voc数据集的样本格式,首先是比较重要的几个,Annotation,ImageSets和JPEGImages这三个是比较重要的文件夹,里面存放的东西如下:Annotation:里面放了一堆xml文件,每个xml文件对应着一...
2018-11-21 17:52:04
1206
2
原创 mean-shift图像跟踪代码
mean-shift算法,通过已知的上一帧图像的坐标,计算上一帧的图像的二维直方图特征,在下一帧的相同位置附近进行匹配,并逐渐将下一帧的跟踪坐标收敛。在这里具体数学推导暂先不理会,算法大致实现分如下几个部分:一、目标区域的二维直方图特征图构建def Colourfeature(red, green, blue): r = red / 256.0 g = green /...
2018-11-07 21:33:52
682
2
原创 YOLO笔记
在faster—RCNN的基础上,最近又开始着手了解YOLO系列的目标检测网络,YOLO网络改变了faster-rcnn的将目标检测分为候选框提取与分类两部分的模式,直接采用一个较深的卷积神经网络,同时完成边界框的回归与框内物体识别两个任务。一、预测原理整个YOLO网络的工作模式如下所示:可以看到,直到展开成4096前,都是在疯狂卷积,之后,最后一层卷积后,得到了一个7x7x30的...
2018-11-02 18:22:35
327
原创 faster-rcnn代码解读记录,github+tf
小小白最近对目标检测比较感兴趣,于是看了许多关于rcnn相关的文章博客,大致有了一些概念,结合在github下的一份大牛代码,研读了几天写一下大体思路。首先,整个网络大体有三个部分组成,首先是公共的特征提取网络,目前在看的源码中可以选择VGG16等网络来作为特征提取网络,继而在特征提取网络的最后输出的基础上,再加一个RPN网络,RPN网络主要用于输出候选框(roi)的坐标修正量以及针对每一个候...
2018-10-09 20:51:26
15899
11
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅