- 博客(63)
- 资源 (4)
- 收藏
- 关注
原创 使用训练好的caffemodel,对测试图像做自动分类预测
笔者硕士阶段论文研究方向为:基于卷积神经网络的绘画图像分类研究, 需要使用训练好的caffemodel,对测试绘画图像进行分类和预测其类别。 本测试程序依赖python版本的caffe,需要将binaryproto格式均值文件转化为npy格式均值文件,代码如下:#coding=utf-8import syssys.path.append("D:\\Anaconda2\\...
2018-06-02 11:51:38
1739
原创 用作者提供的net1->net2生成MTCNN的训练样本(positive,negative,part,landmark)
本代码基于作者提供的python版本代码修改,参考:https://github.com/DuinoDu/mtcnn/blob/master/demo.py (作者提供)https://github.com/dlunion/mtcnn/blob/master/train/gen_48net_data2.py1,生成positive,negative,part三种样本,
2017-08-31 21:13:44
5845
原创 用我们训练的MTCNN中o-net测试训练图片的landmark的mean error
为了验证我们训练的MTCNN的O-Net在训练集上的表现,我们写了一个测试代码,来测试训练图片的landmark的mean error。landmark标签格式如下所示:48/landmark/0.jpg -1 -1 -1 -1 -1 0.224199 0.505338 0.334520 0.327402 0.583630 0.364769 0.336299 0.596085 0.6743
2017-08-30 21:13:58
3344
4
原创 MTCNN中将自己训练的o-net接在作者提供的net1,net2后面python代码解读
基于原作者提供的python版本MTCNN修改,开源地址:https://github.com/DuinoDu/mtcnn我们的o-net训练代码参考如下开源项目:https://github.com/dlunion/mtcnn并做了适当修改参考:http://blog.youkuaiyun.com/xzzppp/article/details/76467514将我们训练的模型级联在作者提
2017-08-28 19:57:54
6648
1
原创 MTCNN中用celebA样本生成landmark训练样本python代码解读
最近跑通了MTCNN的训练代码,对其中生成positive,negative,part样本gen_48net_data2.py代码进行修改。项目地址:https://github.com/dlunion/mtcnn对应代码地址:https://github.com/dlunion/mtcnn/blob/master/train/gen_48net_data2.py
2017-08-28 17:36:32
4287
1
原创 在windows,linux平台进行caffemodel的批量训练
笔者之前在训练caffemodel的时候,都是先设置好一个网络模型,然后再在命令行中输入训练执行命令比如(linux中):./build/tools/caffe train --solver=examples/mydata/huihua_dongfang/mynetV2/solver.prototxt后来发现写一个批处理程序,可以一下子处理很多个网络模型,非常简单高效,能将自己从简单劳动
2017-08-28 16:58:22
1100
原创 300W数据集测试MTCNN的landmark效果代码
300W数据集测试MTCNN的landmark效果,用提取其中afw数据集337张图片的预测关键点并写入到txt中,再用测试程序和标注landmark做对比。处理得到的预测landmark格式如下:1051618982(图片名)1(landmark个数)543 267 643 268 594 322 542 359 643 36011107651921095
2017-07-31 20:26:20
4651
1
原创 修改MTCNN中caffe源码,时计算loss时以对应标签是否为“-1”判别
MTCNN训练不收敛原因:地址: https://github.com/dlunion/mtcnn我们的训练数据标签格式:wider face:pos/001.jpg 1 x1 y1 x2 y2 (x1 y1 x2 y2) -1 -1 -1 -1 -1 -1 -1 -1 -1 -1part/001.jpg -1 x1 y1 x2 y2 (x1 y1 x2 y2)
2017-07-31 19:55:41
4151
1
原创 C++批量隔行筛选标签txt文件
在深度学习模型训练中,我们很可能只需要原来1/3,或1/5的样本量,手动筛选耗时耗力。用c++实现自动筛选比较自动化和省事。 要实现0-521625每2个取一个,521625-764126全取,764126- 每3个取一个,代码如下:#include #include #include #include #include #include #include usin
2017-07-31 09:33:32
1139
原创 C++批量对图片进行水平镜像、切片、旋转、添加椒盐噪声(小样本学习中图像扩充)
C++实现:批量对图片进行水平镜像、切片、旋转、添加椒盐噪声。 应用场景:小样本学习中图像扩充。#include #include #include #include using namespace cv;using namespace std;Mat addSaltNoise(const Mat srcImage, int n);Mat rotateImage(
2017-07-24 09:29:26
1817
原创 用faster rcnn对celebA的bbox重新标注,c++实现筛选,过滤无效bbox
在对MTCNN进行landmark训练前,发现celebA数据集人脸bbox的标注不准确(landmark标注准确,可以使用),所以需要对人脸bbox进行重新标注,选择用faster rcnn对celebA数据集的bbox重新标注。参考博客:http://blog.youkuaiyun.com/xzzppp/article/details/52071546 用faster rcn
2017-07-20 11:25:46
1561
1
原创 python脚本实现给定标注bbox,landmark在原图中显示人脸框,人脸关键点
程序功能简介:利用给定的标注bbox,landmark在原图中显示人脸框,人脸关键点:给定标注txt文件数据格式,如下图所示:lfw_5590\Aaron_Eckhart_0001.jpg 84 161 92 169 106.250000 107.750000 146.750000 112.250000 125.250000 142.750000 105.250000
2017-07-19 15:03:04
3546
原创 MTCNN中生成positive,negative,part样本python代码解读
最近跑通了MTCNN的训练代码,对其中生成positive,negative,part样本gen_48net_data2.py代码进行解读。项目地址:https://github.com/dlunion/mtcnn对应代码地址:https://github.com/dlunion/mtcnn/blob/master/train/gen_48net_data2.pyimport
2017-07-18 19:12:09
5896
1
原创 C++ fstream流批量处理txt文件
一、用fstream流批量读取wider face标注txt文件,实现将一个图片标注写成一行,写入txt文件中(显示相应人脸框)。#include #include #include #include #include #include #include using namespace cv;using namespace std;int main()
2017-07-17 11:02:38
2680
原创 face alignment中opencv读取pts文件并修改系列程序
一、读取300W数据集中测试数据集pts标注文件,在原图中显示68个人脸关键点。https://ibug.doc.ic.ac.uk/resources/facial-point-annotations/#include #include #include using namespace cv;using namespace std;int main(){
2017-07-11 19:22:50
3867
原创 人脸关键点检测数据库&人脸关键点检测最新方法调研
一、人脸关键点检测数据库(2001年发布)BioID :约1000幅图像,每个人脸标定20个关键点。https://www.bioid.com/About/BioID-Face-Database(2011年发布)LFPW:1132幅图像,每个人脸标定29个关键点http://neerajkumar.org/databases/lfpw/(2011年发布)AFLW
2017-07-11 09:32:03
5333
原创 关于研究一个新领域,研究思路的总结
开展一个新的领域研究,研究思路大致如下: 1,调研公开的基准数据集,如人脸检测的fddb,人脸关键点检测的300W,对比分靠前的文章进行研究(一开始主要关注:速度,精度两个指标),了解该领域在精度和速度情况; 2,对比分排名较高的文章进行仔细研究,并调研该文章引用的文章(选取效果较好的方法,效果一般和较差的不研究),了解这些方法在公开数据集上的表现,并研究方法。
2017-07-10 19:50:31
2779
原创 Deep Convolutional Network Cascade for Facial Point Detection实践总结
测试代码:https://github.com/luoyetx/mini-caffe/tree/master (example中deeplandmark例子)训练代码:https://github.com/luoyetx/deep-landmark测试代码的配置参考:http://blog.youkuaiyun.com/xzzppp/article/details/68495
2017-07-10 19:46:31
4052
原创 Deep Convolutional Network Cascade for Facial Point Detection阅读笔记
简介:本文提出使用3-level convolutional networks(三层卷积神经网络)级联,做人脸关键点检测的方法。一些传统的方法使用训练图片的平均人脸关键点作为初始化的人脸关键点,这样的初始化方式效果并不是很好,为解决这个问题,本文提出三级级联的CNN关键点检测方法。本文方法使用第一层卷积层做人脸关键点初始化,即将整个图像输入到CNN中,提取图像全局特征,全局特征有利于高准确率的关键
2017-07-10 18:15:12
1516
原创 MTCNN批量读取图片进行人脸和关键点检测,并保存检测结果
本博客在上一篇博客基础上添加了批量处理图片的功能,上一篇博客: Windows下cmake编译caffe,实现纯C++版本MTCNN人脸检测和关键点定位 作者提供的程序是读取摄像头视频,而我需要读取图片,且利用txt文件批量读取图片,分别对每一张图片进行人脸检测和人脸关键点检测,并保存检测结果(也可以显示每张图片效果图)。使用时,替换原来的
2017-07-10 14:52:14
5134
原创 Windows下cmake编译caffe,实现纯C++版本MTCNN人脸检测和关键点定位
2017.5.28 发现 caffe官方windows版本已经不提供vs工程文件了,需要用cmake编译生成sln文件。详细编译调试过程如下: 一、开发环境要求: Windows 7/10,64位系统,Visual Studio 2013以上版本,推荐使用VS2015,安装anaconda2.4或以上版本。 二、下载caffe windows版本源码,生成vs
2017-06-14 11:06:45
13846
9
原创 linux平台OpenBLAS编译和安装简介
OpenBLAS是高性能多核BLAS库,是GotoBLAS2 1.13 BSD版本的衍生版。项目主页在:https://github.com/xianyi/OpenBLASlinux平台OpenBLAS编译和安装步骤1、安装cmake,执行以下命令sudo apt-get install cmake2、安装cmake-gui,执行以下命令sudo apt-g
2017-04-07 20:26:41
14901
原创 linux-arm交叉编译 OpenBLAS编译和安装
1、安装编译linux-arm平台交叉编译工具,默认已经安装参考:http://blog.youkuaiyun.com/xukai871105/article/details/249326112、下载OpenBLAS源代码下载地址:https://github.com/xianyi/OpenBLAS3、编译OpenBLAS的arm库文件,在openblas根目录执行以下命令
2017-04-07 19:46:57
11850
3
原创 mini-caffe vs2013编译
1. 用git下载 https://github.com/luoyetx/mini-caffe.git mini-caffe/3rdparty/src/ 目录下引用了openblas和protobuf依赖项,最好git下载完整代码,并分别替换openblas和protobuf文件夹。2. 编译protobuf3rdparty\lib\libopenblas.lib 已经自带,pro
2017-03-30 20:18:19
4096
原创 Linux下如何添加附加包含目录和依赖库(和windows下visual studio中类比)
一、添加附加包含目录 法1:-I path(path为头文件路径) 法2:将头文件拷贝到 /usr/local/include中 相当于VS中添加包含路径,如下图所示:二、添加依赖库 法1,编译阶段,g++编译器编译: -L path –lcaffe(path为附加库目录路径;-l指定附加依赖项,比如
2017-03-30 18:50:43
6178
原创 VS2015+opencv3.2的dnn库跑caffe格式例子
在cmake3.7编译VS2015+opencv3.2的第三方库中dnn库(http://blog.youkuaiyun.com/xzzppp/article/details/54926117)的基础上,本博客计划用生成的dnn库,跑caffe格式程序,实现图像分类或人脸比对。 具体步骤如下: 1、在VS2015中新建一个工程,取名opencv_test,在源文件中新建一个cpp源文件,取
2017-02-08 17:21:08
4237
1
原创 cmake3.7编译VS2015+opencv3.2的第三方库中dnn库(win7系统64位)
由于需要使用opencv3.2的第三方库中dnn库做人脸比对(opencv+dnn深度学习框架),而官网下载的opencv中没有dnn模块,故需要用cmake编译opencv,opencv_contrib中源码,得到dnn库。 一、准备工作 我电脑配置有:win7系统,64位,visual studio 2015。 opencv3.2下载:http://opencv.
2017-02-08 16:01:19
9734
2
原创 caffe 数据结构
caffe由Blob、layer、Net组成。prototxt文件定义caffe的Net,Net由许多layer构成,Blob是构成layer的基本概念。 1、以Blob为例,讲解一个Blob测试程序,test_blob.cpp:/* * * 功能: * 1. 测试使用Blob * 2. 给blob赋值 * 3. 获取blob指定位置的值 * 4. 输出通过L
2017-01-06 19:16:44
1115
原创 caffe中卷积计算详解
卷积是卷积神经网络的重要组成部分,消耗整个网络中大量计算资源,理解卷积计算过程,对优化网络结构和简化网络模型非常重要。 正常卷积的实现如下图所示: 非常重要的是:卷积核其实和特征图一样,是一个三维矩阵,这点需要注意。 上图是一个典型的卷积过程。第一列是一个7*7*3的特征图;第二列是第一个卷积核,大小为3*3*3;第三列是第二个卷积核,
2016-11-25 18:41:10
9315
1
原创 Faster rcnn test浮点运算次数(卷积实现过程,Faster rcnn总体结构和参数)
我在调试faster rcnn demo.py的代码后,用监控卡口图片做了测试,并统计了其浮点运算次数(这只是一个粗略的统计,即仅统计了卷积部分乘法运算次数),另外,该代码可以通过pycharm调试,为了能深入理解其内部原理,建议大家动手调试。 上表中,结合protobuf文件,我们知道,layer_name表示层名,bottom表示层输入数据,top表示层输出数据,kernel_si
2016-11-24 10:16:11
7597
2
原创 Linux常用命令
1、 cd:切换工作目录cd /usr/local/include:进入到/usr/local/include目录下;2、 Ctrl+Alt+T:打开一个新的命令行窗口3、ls:显示当前目录下文件列表在命令行窗口中输入ls即可;4、 unzip filename.zip:解压zip格式文件,其他格式类似;5、cp:拷贝,格式:cp 源文件 目标目录sudo cp
2016-11-23 14:49:52
1280
原创 Mxnet+nnpack安装教程,以及踩过的坑
一、NNPACK1、NNPACK简介:NNPACK由facebook开发,是一个加速神经网络计算的加速包,NNPACK可以在多核CPU平台上提高卷积层计算性能。NNPACK采用的快速卷积算法是基于Fourier transform 和 Winograd transform算法。(http://blog.youkuaiyun.com/mrhiuser/article/details/527674
2016-11-22 20:32:19
5842
原创 Faster rcnn相关文章研究
一、效果简介1 多类目标检测,基于VOC2012数据集 MAC :The number of adds andmultiplications mAP:Mean average precision GPU:NVIDIA Titan X 我们目前的人脸检测模型是:Faster R-CNN + VGG_CNN_M_1024,即VGG-16的简
2016-10-31 21:12:20
6024
原创 faster rcnn RPN之anchor(generate_anchors)源码解析
英文原文:faste rcnn。其中生成RPN(Regional proposal network)的python代码解析本代码主要用于:生成尺度为:128,256,512; 宽高比为:1:2,1:1,2:1的anchor#功能描述:生成多尺度、多宽高比的anchors。# 尺度为:128,256,512; 宽高比为:1:2,1:1,2:1import numpy
2016-08-25 20:13:19
17092
4
转载 caffe源码解析之blob.hpp或blob.cpp
作者:wjmishuai出处:http://blog.youkuaiyun.com/wjmishuai/article/details/50961471声明:版权所有,转载请注明出处caffe可以分为三层:Blob、Layer、NetBlob是一个四维的数组,用于存储数据,包括输入数据、输出数据、权值;Layer层则是神经网络中具体的各层结构,主要用于计算,在根
2016-08-22 15:02:02
1325
原创 GoogleNet:Going deeper with convolutions
论文原文:Going deeper with convolutions网络模型名字:GoogleNet1、简介 2014年ImageNet冠军。本文设计了22层深度神经网络,同时增加网络深度和宽度,较大地提高了识别率。使用1*1,3*3,5*5卷积核,中间增加两个辅助分类器(提高识别率)。 googleNet分类和定位效果显著,且不是一个纯粹的学术研
2016-08-19 19:12:29
2250
1
原创 VGG:Very Deep Convolutional Networks for Large-Scale Image Recognition阅读笔记
论文原文:Very Deep Convolutional Networks forLarge-Scale Image Recognition网络模型名字:VGG-16、VGG-191、简介 2014年ImageNet亚军。本文主要研究了卷积神经网络深度对大尺度图像识别精度的影响。在现有网络结构的基础上,不断增加3*3卷积核,当深度增加到16-19层时,识别效果有较
2016-08-19 19:04:01
9487
1
原创 小米手环2来电不震动,来电不提醒怎么办
1、问题: 本人用的华为P7手机,买了个小米手环2,但在使用中发现:当有来电时,手环有时不提醒,有时不震动,且不提醒、不震动的概率较大。2、寻找问题: 小米手环2来电提醒前提:小米运动app、蓝牙同时打开且链接。 于是我借来同事的手环,绑定在我手机上调试。发现:两个手环在我手机上均会出现来电不提醒、不震动的情况;而在同事手机上两个手环使用均正常。于是发现:问
2016-08-15 19:04:04
37006
原创 A Committee of Neural Networks for Traffic Sign Classification 阅读笔记
1、图像预处理 原图大小15*15→ 放大到250*250→ 修剪边界框多余部分→缩小到48*48。 RGB三通道像素是线性缩放的,加减1个标准差左右的平均像素强度;RGB三通道像素,加减2个标准差左右的平均像素强度;直方图均衡化。 分别用彩色图像和灰度图像,这样就有了8种不同的数据集。2、实验 用
2016-08-08 10:27:56
1415
原创 零基础学caffe源码 ReLU激活函数
1、如何有效阅读caffe源码 1、caffe源码阅读路线最好是从src/cafffe/proto/caffe.proto开始,了解基本数据结构内存对象和磁盘文件的一一映射关系,中间过程都由ProtoBuffer工具自动完成。 2、看include/目录中.hpp头文件,通过头文件类申明理解整个框架。从基类向派生类,掌握这些类。 3、看src/目录中.
2016-08-03 17:30:19
6527
2
opencv3.2 protobuf-cpp-3.1.0.tar.gz
2017-02-08
opencv3.2 ippicv_windows_20151201下载
2017-02-08
opencv3.2版 opencv_ffmpeg_64下载
2017-02-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人