
计算机视觉
gdmmzmj
这个作者很懒,什么都没留下…
展开
-
matlab学习笔记(1)
为了做计算机视觉课程的大作业,比如说harris detection这些作业。我学习了一下matlab的用法,其实主要就是各种函数的使用。 下面开始正式的学习。imread 函数imread用于读取图片文件中的数据。 调用格式:imgRgb = imread(‘e.bmp’);A = imread(filename,fmt) [X,map] = imread(filename,fmt)原创 2016-06-09 13:38:09 · 469 阅读 · 0 评论 -
关于dll的使用和配置
山世光组在2016年9月发布了人脸识别代码SeetaFaceEngine。为了了解他们的代码,我尝试去创建工程。在这个过程中,发现要生成并使用dll。于是在网上查找资料。现在把工程的详细配置说明如下。首先下载代码:[https://github.com/seetaface/SeetaFaceEngine]发现里面有三个不同功能的模块,face detection,face alignment,fa原创 2016-09-17 23:28:13 · 1797 阅读 · 0 评论 -
caffe如何做卷积
想象一副图像尺寸为MxM,卷积核mxm。在计算时,卷积核与图像中每个mxm大小的图像块做element-wise相乘,相当于把该mxm图像块提取出来,表示成一个长度为m^2的列,共有多少个这种图像块?在不考虑pad和stride的情况下,一共有(M-m+1)^2个,把这么些个图像块均表示为m^2的列,然后组合为一个大矩阵(m^2 x (M-m+1)^2)。这里的操作就是img2col中做的事,mat转载 2017-07-14 19:47:52 · 358 阅读 · 1 评论 -
caffe的总体流程是怎样的?(转载)
转载自caffecn我很想详细讲一下的,然而自己才疏学浅,学艺不精,只能大概讲讲,就当抛砖引玉了(⊙v⊙)很多人建议caffe从四个层次来理解:Blob、Layer、Net、Solver,和题主的问题还挺match的1.Blob Blob是caffe基本的数据结构,用四维矩阵 Batch×Channel×Height×Weight表示,存储了网络的神经元激活值和网络参数,以及相应的梯度(激活值的残转载 2017-07-15 09:20:14 · 296 阅读 · 0 评论 -
caffe hinge loss 解析
输入: bottom[0]: NxKx1x1维,N为样本个数,K为类别数。是预测值。 bottom[1]: Nx1x1x1维, N为样本个数,类别为K时,每个元素的取值范围为[0,1,2,…,K-1]。是groundTruth。输出: top[0]: 1x1x1x1维, 求得是hingeLoss。关于HingeLoss: p: 范数,默认是L1范数,可以在配置中设置为L1或者L2转载 2017-07-24 23:27:48 · 1009 阅读 · 0 评论 -
caffe加层
caffe加自己的层需要以下步骤: 以添加《Hard-Aware-Deeply-Cascaded-Embedding》论文代码为例这里写链接内容1.修改 caffe_root/caffe/src/caffe/proto 里面的 caffe.proto1⃣️ 添加optional PairFastLossParameter pair_fast_loss_param=147;//LayerParam原创 2017-07-25 00:10:31 · 542 阅读 · 0 评论 -
centerloss 理解
今天看了一下centerloss 源码 ,觉得还是挺值得借鉴的,所以分享一下。 centerloss主要在caffe的基础上加了三项。一. caffe.proto1.加proto 格式 的 ID号1472.加proto格式的定义 这里面的参数都是层的参数,也是超参,在prototxt中赋值。 axis是默认为1的。二.加入hpp 文件到include/caffe/layers/ ,主要包含原创 2017-07-26 00:07:04 · 7576 阅读 · 2 评论