长飞哥-优快云博客

感谢资源共享！3D框估计基于paper《3D Bounding Box Estimation Using Deep Learning and Geometry》https://github.com/smallcorgi/3D-Deepbox对上面的工程进行train和test调试。工程基于tensorflow1.x，如果要用2.x版本来跑，需要对代码进行转换。用tf_upgrade_v2 --infile file --outfile file 只能自动转换一部分代码。tf.cont

2021-04-08 16:09:41 254

原创 psd文件解析

psd文件解析

2020-09-27 14:50:18 5655 22

原创翻页功能实现

开始做翻页效果时发现这方面资料不多，能涉及原理的文章更少，参考这篇文章大致了解了翻页原理，但是后面发现不用那么复杂。下面给一个简要原理：上面手绘图左右两个θ是不一样的。右图的θ就是圆柱放置的角度。贴着圆柱滚动的翻页原理：1、已知a点和f点，真正要计算的点是af中点g点，已经id曲线上的任意一点坐标，比如可以求ga与id的交点g0，此外需求eh直线倾斜角度的正弦si...

2020-03-12 16:01:13 1352

原创关于anchor的解释

第一次接触anchor是Faster-R-CNN中提及的RPN（Region Proposal Network）。在我的博文里【Faster-R-CNN总结】也有介绍Faster-R-CNN的几点总结，但是对anchor的定义没有详细说明。在学习过程中，发现很多人其实没有真正搞懂anchor，本人也是如此，反复研究后总算弄清楚原理。首先明确anchor的位置。a...

2019-02-01 11:54:23 7032 6

原创 Eigen使用稀疏矩阵求解线性方程

Eigen稀疏矩阵求解线性方程，内建的有直接求解器，迭代求解器和第三方求解器。见文档http://eigen.tuxfamily.org/dox/group__TopicSparseSystems.html图二见链接https://blog.youkuaiyun.com/xuezhisdc/article/details/54634080这里是使用Eigen里的迭代求解器，因为矩阵非方阵，也不...

2018-09-13 11:50:34 9078 1

原创梯度下降法入门解析

1、梯度下降法是做什么用的？机器学习中都有一个代价函数，训练时就是要使代价函数值最小，这样假设的值和实际值就越接近。而代价函数中有参数，要使代价函数最小，则需要调节参数，这个过程就是最优化的一个过程，梯度下降法是一个最优化的方法。2、代价函数对其中某参数求偏导数，即得到此参数对应的梯度。而代价函数要达到最小，就要下降，下降有慢有快，下降最快的方向是此参数对应的梯度的反方向，参数朝着其梯度反...

2018-09-13 11:34:59 471

原创贝塞尔曲线插值拟合

参考：https://blog.youkuaiyun.com/ch_soft/article/details/7401582博客原文链接：http://www.antigrain.com/research/bezier_interpolation/index.html#PAGE_BEZIER_INTERPOLATION先上QT中的贝塞尔曲线调用代码，由于控制点计算过于简单，所以插值...

2018-07-20 11:20:59 4335

原创 linux环境下封装YOLOv2算法

YOLOv3已出，不管哪个版本，其封装应该大同小异。之前在windows环境下，以https://github.com/AlexeyAB/darknet版本进行封装，linux下封装也是差异不大，而且linux环境下编译工程更简单。以YOLOv2位例，主要找出test_detector函数void test_detector(char *datacfg, char *cfgfile, ...

2018-05-19 21:15:29 1793 2

原创 YOLOv2+MobileNet，windows下调试

看作者github更新了YOLO2代码，加入了groups机制，加了LSTM功能。要实现基于MobileNet的YOLO2，根据之前基于darknet的YOLO2版本可以简单修改。几个修改的地方：1、部分源文件中net定义变为指针。比如parser.c文件。一一修改。2、在data.c中线程代码段，有些产生随机数的代码需要修改，否则训练会一直跑同一张图像。比如rand()%m，用没有groups版...

2018-02-12 09:02:06 4071 2

原创 YOLO2中的labels文件怎么读取

这几天看代码，一直找不到labels文件的读取代码，只看到读取了图像路径，今天看这位的博客，终于找到。上一篇生成anchors的原理应该就是从这里参考的。见data.c里的fill_truth_detection函数这段find_replace(path, "images", "labels", labelpath); find_replace(labelpath, "JPEGIm

2018-02-01 16:28:17 1400

原创 YOLO2中anchors设置

训练YOLO2时会用到cfg文件，这个网络结构文件里面的Region层有一个anchors参数就是论文中对应的用k-means方法产生的5个box的信息，这些数据的使用在YOLO2代码中可见：1、解析是在parse.c中的parse_region2、使用是调用get_region_boxes函数，其中get_region_boxbox get_region_box(float *x

2018-01-31 13:28:57 10033 1

原创从ResNet101到ResNet50

一直用VGG训练，几天前想看下ResNet的效果如何，因为SSD源码中有python实现的ResNet网络结构实现代码，包含ResNet101和ResNet152，直接拿ResNet101来训练，GTX1060配置，batchsize竟然只降到2才跑的起来，果然一直收敛不了。看了下model_libs.py里面的实现代码：def ResNet101Body(net, from_layer, u

2017-12-29 13:15:58 34171 2

原创 SSD目标检测算法中default box在ssd_pascal.py的设置

在ssd_pascal.py中对default boxes（prior boxes）的设置由如下代码完成：# parameters for generating priors.# minimum dimension of input imagemin_dim = 300# conv4_3 ==> 38 x 38# fc7 ==> 19 x 19# conv6_2 ==> 10 x 1

2017-12-26 15:18:37 1934

原创使用预训练模型对图像进行分类

这里介绍的是直接用训练好的分类任务的预训练模型来测试。当然caffe提供了几种方法进行测试。这里介绍两种：1、直接调用工具2、基于python接口。第一种：使用编译好的calssification工具测试，可以用以下命令：# sudo ./build/examples/cpp_classification/classification.bin \ models/bvl

2017-12-22 16:13:21 4081 1

原创最大池化层的作用

●Theano中对Max-pooling的解释Max-pooling is useful in vision for two reasons:1、By eliminating non-maximal values, it reduces computation for upper layers.2、It provides a form of translation invariance

2017-12-14 11:20:38 18693

转载全连接层的作用

转自知乎作者：魏秀参链接：https://www.zhihu.com/question/41037974/answer/150522307全连接层到底什么用？我来谈三点。全连接层（fully connected layers，FC）在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话，全连接层则起到将学到的“

2017-12-12 20:19:55 10352

原创为什么全连接层输入需要固定尺度

SPPnet的提出就是为了解决全连接层的输入需要固定维度的问题。为什么全连接层的输入需要固定维度？全连接层的计算其实相当于输入的特征图数据矩阵和全连接层权值矩阵进行内积，在配置一个网络时，全连接层的参数维度是固定的，所以两个矩阵要能够进行内积，则输入的特征图的数据矩阵维数也需要固定。

2017-11-28 10:38:35 6922 2

原创多分类问题中的mAP计算

图表参考http://blog.sina.com.cn/s/blog_9db078090102whzw.html 比如有10类，20个样本，判断为其中一类car的置信度如下表所示，降序排列。从表中gt_label可以看出正例是6个，其他是负例。PASCAL VOC CHALLENGE 2010年后计算AP的方法是...

2017-11-28 08:58:56 9240 4

原创图像卷积在代码中的实际操作

在代码中卷积的实际计算方法是把被卷积图像和卷积核写成两个大矩阵，其中每一行就是被卷积图像中卷积核区域的像素拉成一行，几个通道都放在同一行，行数就是卷积核在上面滑动的次数。两个矩阵相乘即为输出结果，结果矩阵中的每一列就是feature map的一个通道。图1 还有一种方式是左边的矩阵是由卷积核转化来的，右边则是被卷积图像，这样的方式比上面的会复杂点。比如输入图像和

2017-11-16 10:43:28 2720

原创关于Faster RCNN几点总结

从two stages的RCNN系列再到one stage的SSD和YOLO，基于深度学习的目标检测算法在这波深度学习浪潮中迎来春天。我相信在后面的5年10年，无论是速度和精度，目标检测会有更大的发展，秋天收获的将是成熟丰硕的果实。本篇总结Faster RCNN中一些较难理解的point，相信大部分人在学习过程中耗费了较大时间精力，且网上有很多信息并无详细说明。本篇需要有RCNN

2017-11-14 15:18:34 2471

转载 caffe基础知识介绍

转载自http://blog.youkuaiyun.com/fengbingchun/article/details/49535873 Caffe的全称应该是Convolutional Architecture for Fast Feature Embedding，它是一个清晰、高效的深度学习框架，它是开源的，核心语言是C++，它支持命令行、Python和Matlab接口，它既可以

2017-10-23 09:24:33 671

转载 GPU和CUDA基础介绍

转载自http://blog.youkuaiyun.com/fengbingchun/article/details/54691225一、GPU简介1985年8月20日ATi公司成立，同年10月ATi使用ASIC技术开发出了第一款图形芯片和图形卡，1992年4月ATi发布了Mach32图形卡集成了图形加速功能，1998年4月ATi被IDC评选为图形芯片工业的市场领导者，但那时候这种芯片还没有GPU的称

2017-10-10 14:35:21 11652

转载 GPU及GPU通用计算编程模型简介

转自http://blog.youkuaiyun.com/fengbingchun/article/details/19619491#comments以下内容来自网络总结： NVIDIA公司在1999年发布GeForce256时首先提出GPU(图形处理器)的概念，随后大量复杂的应用需求促使整个产业蓬勃发展至今。 GPU英文全称Graphic Process

2017-10-10 14:30:07 3644

原创 ubuntu16.04登录后黑屏再次回到登录页面

从linux切换到Windows，再切换回linux时能够到达登录页面，但是发现输入正确的登录密码后，黑屏了3s左右又回到登录页面。其中在启动进入登录页面会出现/dev/sda1: clean, ***/*** files, ***/*** blocks的字样，网上查了也是很多的类似问题，试了很方法，没有用，后面把NVIDIA的驱动卸载掉才能登录。卸载代码：$ sudo apt-get -

2017-08-11 09:15:14 5209 2

原创 caffe+SSD封装

这几天新建自己的工程来封装caffe框架下的ssd算法。遇到一些问题归纳如下：1、利用NuGet程序包，进行依赖性的自动设置，自己的工程再加上libcaffe.lib即可。2、把原来工程下的include和src文件夹都拷到工程下。3、编译时碰到GPU没有定义，可能是在工程的c/c++选项的预处理定义中定义了宏GPU，导致了冲突，去掉后编译成功。4、

2017-08-09 15:47:12 1734

原创 SSD算法训练

没接触过linux，直接在linux下配置环境+训练ssd，用了快一周时间，各种坑，各种吐血，因各人平台配置差异，以下仅供参考。平台：Ubuntu16.04+GTX1060 6G（GPU型号）+处理器64位 CUDA：CUDA8.0,直接上Nvidia官方网站下载，选择cuda_8.0.61_375.26_linux.run cuDNN：cuD

2017-07-18 16:23:15 4400 1

原创 YOLO2训练

YOLO2训练小记：用了600张图像，制作训练集，设置batch = 30，subdivisions = 6, 设置每10个batch后就输出一个中间模型，我把yolo-voc_20.weights，yolo-voc_30.weights，yolo-voc_40.weights分别test，yolo-voc_20.weights，yolo-voc_30.weights两个模型测

2017-06-27 10:02:14 3275 4