
图像识别和分类
大白机器人
这个作者很懒,什么都没留下…
展开
-
Caffe 基本层参数简介
Caffe更新很快,以下内容可能与最新master有出入,不过如果参数名字没有更改应该没有变化。具体可以查看src/caffe/proto/caffe.proto文件内的定义。1. Data输入层 name / type / top / bottom 是所有layer都有的参数域,DATA层与众不同的是包含data_param和transform_param两个域,并且通常包含会有data和la...转载 2018-03-19 11:21:12 · 308 阅读 · 0 评论 -
slice和concat实现MultiTask--人脸检测MTCNN
http://blog.youkuaiyun.com/shuzfan/article/details/54565776目录(?)[+]最近一段时间MultiTask网络比较流行,比如做人脸检测的时候,一个网络完成(人脸和非人脸)二分类任务的同时也要进行boudingbox回归或者人脸关键点回归。以人脸检测MTCNN为例,一个网络包含三个任务。训练的时候,一个batch中的图片,一部分用于二分类、一部分用于bo...转载 2018-03-19 11:22:23 · 507 阅读 · 0 评论 -
docker ,nvidia-docker,docker-compose和nvidia-docker-compose的安装配置
预先安装:Ubuntu14.04,SSH,GIT,CUDA-8.0一、安装docker安装最新版// 1. 安装必要的一些系统工具sudo apt-get updatesudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common// 2. 安装GPG证书curl -f...原创 2018-03-27 14:56:06 · 2676 阅读 · 0 评论 -
ubuntu 安装NVIDIA驱动或CUDA报错:“The driver installation is unable to locate the kernel source....” 或者是无法登录
ubuntu 安装NVIDIA驱动或CUDA报错:“The driver installation is unable to locate the kernel source....” 或者是无法登录系统界(loop login )主要原因更主板的BIOS设置有关!!UEFI下的设置这里首先要重启,华硕主板按Delete或者F2进入UEFI界面。UEFI禁用Fast Boot进入UEFI后,按F7...原创 2018-04-03 19:54:20 · 3315 阅读 · 0 评论 -
人脸标注数据集
1.CalebA人脸数据集(官网链接)是香港中文大学的开放数据,包含10,177个名人身份的202,599张人脸图片,并且都做好了特征标记,这对人脸相关的训练是非常好用的数据集。2.WIDER FACE dataset is a face detection benchmark dataset, of which images are selected from the publicly av...原创 2018-08-15 14:42:48 · 248791 阅读 · 0 评论 -
Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks
概论用于人脸检测和对齐。本文提出的unified cascaded CNNs by multi-task learning,包含三个阶段:1) 利用一个浅层的CNN快速产生候选窗口2) 利用一个更复杂的CNN排除掉大量非人脸窗口3) 利用一个更强大的CNN进一步改善结果,并输出人脸关键点位置。本文的贡献:1) 提出一个新的基于CNN的级联型框架,用于联和(joint)人...转载 2018-08-15 15:42:55 · 845 阅读 · 0 评论 -
目标检测之Loss:FasterRCNN中的SmoothL1Loss
多任务损失(来自Fast R-CNN) multi-task数据结构Fast R-CNN网络有两个同级输出层(cls score和bbox_prdict层),都是全连接层,称为multi-task。① clsscore层:用于分类,输出k+1维数组p,表示属于k类和背景的概率。对每个RoI(Region of Interesting)输出离散型概率分布通常,p由k+1类的全连接...转载 2018-08-15 18:38:35 · 1891 阅读 · 0 评论 -
GoogleNet的Inception_v1、Inception_v2、Inception_v3、Inception_v4(整理)
来自caffeCN的一个简要的总结(http://caffecn.cn/?/question/255):先上Paper列表:[v1] Going Deeper with Convolutions, 6.67% test error, http://arxiv.org/abs/1409.4842 [v2] Batch Normalization: Accelerating Deep Net...转载 2018-08-20 14:17:30 · 863 阅读 · 0 评论 -
面试总结(一)
1.信息熵的计算公式 其中X表示随机变量,随机变量的取值为(x1,x2,…,xn),p(xi))表示事件xi发生的概率,且有∑p(xi)=1.信息熵的单位为bit。2.香农公式:注:B为信道带宽;S/N为信噪比,通常用分贝(dB)表示。3.PCA算法对于满足哪种样本分布的数据有效?主成分分析(PrincipalComponentAnalys...原创 2018-08-30 19:17:55 · 408 阅读 · 0 评论 -
简析过拟合与欠拟合
欠拟合与过拟合问题是机器学习中的经典问题,尽管相关的讨论和预防方法非常多,但目前在许多任务中仍经常会出现过拟合等问题,还没有找到一个十分通用、有效的解决方法。不过总体上看,现在人们常用的一些很简洁的方法基本上能够较好地解决欠拟合与过拟合问题,总结如下。欠拟合与过拟合的概念的成因比较简单,观点统一,这里不再介绍。现在常用的判断方法是从训练集中随机选一部分作为一个验证集,采用K折交叉验证的方式,用...转载 2018-08-28 08:33:22 · 16960 阅读 · 0 评论 -
CNN卷积层的输出feature map的尺寸计算
output_size=( input_size + pad * 2 - conv_size ) / stride + 1输入:N0*C0*H0*W0 输出:N1*C1*H1*W1 输出的feature map大小: H1=H0+2×pad−kernel_sizestride+1 W1=W0+2×pad−kernel_sizestride+1 注:当stride为1时,若pad=kernel_si...原创 2018-03-15 12:06:40 · 7470 阅读 · 0 评论 -
Python搭建API,并通过Thrift 和C++进程通信,遇到了一个大BUG!
在做一个图像的项目,为期3个月,前两个月进行开发,开发比较顺利,最后留一个月进行测试,测试的过程中,我们自己模拟客户各种可能的请求,包括压力测试都通过了。可是在项目最后和客户交接的过程中,遇到了我写代码有史以来的最大的BUG。客户在使用的过程中发现,视频流在传输的过程中经常会发生中断,没有数据传回。一开始认为是网络不稳定造成的,经过对方专业人员测试确实存在网络不稳定,造成视频流卡顿,获原创 2018-01-25 15:34:08 · 1049 阅读 · 0 评论 -
用ImageNet的数据集训练Faster R-CNN
转自:http://blog.youkuaiyun.com/jiajunlee/article/details/50470897训练结果第一次训练,ZF,30W张图片,200类,迭代80k40K,mAP: 18.0%问题汇总总结:ImageNet训练数据集部分标注缺失object标签ImageNet训练数据集object的宽高比过大问题1: 训练迭代转载 2016-01-28 11:59:36 · 6219 阅读 · 0 评论 -
关于AdaBoost的一些再思考
一、Decision Stumps:Decision Stumps称为单层分类器,主要用作Ensemble Method的组件(弱分类器)。一般只进行一次判定,可以包含两个或者多个叶结点。对于离散数据,可以选取该属性的任意一个数据作为判定的分割点;对于连续数据,可以选择属性的一个阈值做为分割点进行判定(大于该阈值分配到一类,小于该阈值分配到另一类;当然也可以选取多个阈值并由此得到多个叶结点)。转载 2016-03-04 18:09:46 · 1411 阅读 · 0 评论 -
关于adaboost的一些浅见
周末没上微博,今天一来,发现微博上大家对adaboost进行了热烈的讨论。讨论源于@老师木 这个神人抛了三个问题,无数大牛争相回答。这三个问题是:1,adaboost不易过拟合的神话。2,adaboost人脸检测器好用的本质原因,3,真的要求每个弱分类器准确率不低于50%。关于第一个和第二个问题,包括@ICT山世光 @南大周志华两位大牛在内的很多同学都给了回答。转载 2016-03-04 20:38:37 · 2106 阅读 · 0 评论 -
[mjpeg @ 0x27ee9e0] buffer smaller than minimum size
在利用opencv读取视频,去除视频画面上的水印、台标和logo,并重新在生成新的视频。代码如下:原创 2016-05-16 10:53:00 · 1302 阅读 · 0 评论 -
视频去除水印、台标和logo,并重新在生成新的视频
视频去除水印、台标和logo,并重新在生成新的视频原创 2016-05-16 18:15:16 · 13608 阅读 · 4 评论 -
几个易混淆的概念(准确率-召回率,击中率-虚警率,PR曲线和mAP,ROC曲线和AUC)
准确率-召回率,击中率-虚警率,PR曲线和mAP,ROC曲线和AUC转载 2016-05-17 17:13:53 · 14152 阅读 · 2 评论 -
CUDA 和opencv安装问题
CUDA 和opencv安装问题原创 2016-06-03 15:55:52 · 12894 阅读 · 1 评论 -
全卷积网络:从图像级理解到像素级理解-FCN图像分割边缘检测
作者:果果是枚开心果链接:https://zhuanlan.zhihu.com/p/20872103来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。卷积神经网络(CNN):图像级语义理解的利器自2012年AlexNet提出并刷新了当年ImageNet物体分类竞赛的世界纪录以来,CNN在物体分类、人脸识别、图像检索等方面已经取得了令人瞩目的成转载 2016-05-22 00:42:15 · 25225 阅读 · 1 评论 -
OpenCV ERROR: Insufficient memory问题和imread(img_path)读取图片失败问题
“OpenCV ERROR: Insufficient memory”报这个错误主要是vs2013项目的x86架构下的内存太小,无法加载更多的数据。解决方法是将项目切换到x64架构,就可以解决。但不仅仅是把解决方案平台改成x64这么简单。做法如下:1、将项目属性下面的库目录,改成:D:\opencv_2.4.10\opencv\build\x64\vc12\lib;$(VC_Libra原创 2016-07-22 18:07:03 · 3619 阅读 · 0 评论 -
Ubuntu安装cuda7.5和caffe&cannot find -latlas
Ubuntu安装cuda7.5和caffe原创 2016-05-30 15:59:50 · 3979 阅读 · 0 评论 -
学习Faster-RCNN (一)跑Faster-RCNN的python版demo
一、准备材料在官网“https://github.com/rbgirshick/py-faster-rcnn#installation-sufficient-for-the-demo”,下载demo,阅读“README.md”,按照网址:“https://github.com/rbgirshick/py-faster-rcnn#installation-sufficient-for-the-d原创 2016-01-22 13:52:38 · 8414 阅读 · 0 评论