
vision
文章平均质量分 64
taneijia
这个作者很懒,什么都没留下…
展开
-
使用sklearn-theano来做object detection目标检测 (OverFeat)
目前目标检测比较好的两种方法是Fast-RCNN和OverFeat。我更喜欢OverFeat,因为OverFeat完全使用CovNet来做Classification,Localization和detection,比Pip Line的方法好多了,简洁并且减少经验性的东西。最终也方便做到end-end的Training。尝试一下如何使用OverFeat。OverFeat的代码包是sklearn-the原创 2015-05-28 10:03:17 · 4352 阅读 · 0 评论 -
深度卷积神经网络的行人检测 (pedestrian detection)
行人检测 (pedestrian detection)是智能交通视频分析的基础技术之一。1 现有的方法基于HOG方法基于DPM基于卷积神经网络基于HOG方法已经研究了很多年,有一些现成的代码实现,速度看起来也是比较快的,可以做到500帧每秒的检测速度(640*480,GTX295)。基于DPM的方法其实也是基于HOG的,只不过为行人的图像构建可以变形的模型,这样在检测行人的时候更为鲁棒。基于原创 2015-07-08 09:11:25 · 17521 阅读 · 4 评论 -
面部特征点检测 facial keypoints tutorial
按照Daniel Nouri的Tutorial(2014年12月写的)实验一下,目的是: 1. 玩一下面部特征的定位 2. 再熟悉一下Lasagne的使用。1 准备数据集在Kaggle上注册,然后下载facial keypoints tutorial的数据集,包括如下文件。并将文件放入$home/data/kaggle-facial-keypoint-detection目录中。IdLookupT原创 2015-06-13 13:04:49 · 3429 阅读 · 1 评论 -
用Lasagne来实现MLP,测试mnist
虽然Lasagne自带的examples中带有MNIST的例子,但是这个例子的风格更接近用Theano来写。使用nolearn.lasagne中的NeuralNet类来写MLP似乎更符合Lasagne的设计初衷,也更像Caffe的风格。code没有比代码更清楚地了:# Using lasagne to fit mnist.# show how to use NeuralNet# Tarrega,原创 2015-06-11 12:35:15 · 2004 阅读 · 0 评论 -
Image Roi Proposal , Object Proposals( 翻译成什么好 )
Image Roi Proposal , Object Proposals( 翻译成什么好 )标签(空格分隔): vision物体检测的套路还是需要先得到一些Roi,然后判断这些Roi中是什么物体。 为了防止有漏网之鱼,所以,一般在一幅图中会有上千个Roi。Object Proposals有影响力的算法当然是Selective Search。但是这个领域进步很快, 从GoP的测试来看,目前Rec原创 2015-05-25 18:38:39 · 4560 阅读 · 0 评论 -
安装测试Lasagne
Lasagne(n.烤宽面条),大概是一种美食,是不是就是我们的炒面或者是焗面条。我感觉Lasagne是对Theano的一种封装。Theano的Symbolic Math非常漂亮,但是可能比较难理解。Lasagne将Theano的封装了一下,构造DNN的时候,用Lasagne 就基本够用了,Lasagne的接口就比较容易理解一点。当然,如果你有自己的其他想法,还是需要用Theano来自己实现(甚至原创 2015-06-11 07:58:32 · 8743 阅读 · 0 评论 -
Fast-R-CNN_VOC_example
用FR-CNN来运行一个图片中目标检测的例子安装了FR-CNN以后,运行demo.py没有问题了。 找一个图片来自己测试一下。当然现在还只能使用VOC2007(VOC2012)的图片,因为只有这两个数据集,作者提供了预先计算好的Roi。准备数据从VOC2007中找一个图片。从~/fast-rcnn/VOCdevkit/VOC2007/JPEGImages中选择一张图片,拷贝到 ~/fast-r原创 2015-05-25 18:38:08 · 3431 阅读 · 2 评论 -
安装 Caffe , Berkely的深度学习框架
安装 Caffe , Berkely的深度学习框架标签(空格分隔): vision deepLearningCaffe是Berkeley的一个深度学习框架,方便构造深度学习网络,并在GPU上运行。 安装过程按照Caffe的主页上的描述:http://caffe.berkeleyvision.org/install_apt.html基本系统信息 Basic system information使用U原创 2015-05-25 18:30:55 · 728 阅读 · 0 评论 -
Delve into Fast R-CNN Code. 能够运行Demo,然后看一下代码结构
Delve into Fast R-CNN Code. 能够运行Demo,然后看一下代码结构标签(空格分隔): vision_init_paths.pydemo.py首先import了这个模块,主要就是把路径设置好。# Add caffe to PYTHONPATHcaffe_path = osp.join(this_dir, '..', 'caffe-fast-rcnn', 'python')原创 2015-05-25 18:37:24 · 2408 阅读 · 0 评论 -
运行sklearn-theano的一个例子:benchmark (卷积的各种参数设置)
benchmark中的这个例子计算了各层Transform所需的时间,以及各层的输出。运行并分析一下有助于理解各层网络的结构。How to runpython plot_overfeat_benchmark.py 运行的结果是: (其实整个网络只有12层(0-11)。) 分析分析一下程序运行的输出,测试使用了5张图片,所以ouput.shape第一个维度总是5。图像库asirra中有两类:cat原创 2015-06-03 17:17:17 · 2102 阅读 · 0 评论 -
facial keypoints CNN
自己按照Kaggle的tutorial跑一下facial keypoints,也可以为人脸检测积累更多的数据。参考Daniel的BlogCNN是图像分类的重要工具,如果不明白CNN,可以参见stanford的演示。1 环境准备1 Python环境CUDA toolkit, Python 2.7.x, numpy, pandas, 数据处理matplotlib,scikit-learn,t原创 2015-10-28 08:30:54 · 3531 阅读 · 1 评论