计算机视觉
zbxzc
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Learning Deep Features for Discriminative Localization
Learning Deep Features for Discriminative Localization论文笔记以及Caffe实现论文笔记 | Learning Deep Features for Discriminative Localization论文笔记: Learning Deep Features for Discriminative Localization可以利用论文的思路对原始...原创 2017-11-11 21:10:57 · 1705 阅读 · 0 评论 -
NMS非极大值抑制
非极大值抑制算法Non-Maximum Suppression for Object Detection in Python非极大值抑制算法原创 2016-09-12 11:00:05 · 6385 阅读 · 4 评论 -
CNN卷积神经网络
CNN是一种多层神经网络,基于人工神经网络,在人工神经网络前,用滤波器进行特征抽取,使用卷积核作为特征抽取器,自动训练特征抽取器(即卷积核,即阈值参数)。图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。一般卷积神经网络的结构:前面feature extraction部分体现了CNN的特点,feature extraction部分最后原创 2015-04-23 15:44:57 · 17699 阅读 · 1 评论 -
attention model
自然语言处理中的Attention Model:是什么及为什么深度学习和自然语言处理中的attention和memory机制原创 2016-09-23 10:38:37 · 1704 阅读 · 0 评论 -
背景建模总结
目标检测中背景建模方法背景建模(一) Evaluation of Background Subtraction Techniques统计均值前景检测算法(Mean-variation)前景检测算法-SACON(SAMPLE CONSENSUS)基于局部二值相似性模式(LBSP)的运动目标检测算法codebook-背景建模(三)——以像素值为特征的方法(2)原创 2016-10-18 19:58:02 · 1746 阅读 · 0 评论 -
背景建模之vibe
ViBe算法原理和代码解析原创 2016-09-12 22:40:24 · 1563 阅读 · 0 评论 -
边缘检测
深度学习论文笔记之(一)HED边缘检测原创 2017-05-13 18:21:33 · 903 阅读 · 0 评论 -
目标跟踪总结
最简单的目标跟踪(模版匹配)matchTemplate原创 2016-10-18 17:26:49 · 4839 阅读 · 0 评论 -
faster rcnn源码理解
理解faster rcnn的源码有几个关键点1.算法原理、网络结构、训练过程这是基本2.要弄懂源码里训练数据数据是怎么组织起来的,imdb,roidb,blob很关键,弄清它们的数据结构以及各个阶段是如何产生的3.一定的python、numpy基础知识rpn_train.pt#stage 1训练RPN时用的网络结构name: "ZF"layer {原创 2016-12-12 23:07:19 · 20227 阅读 · 4 评论 -
py-R-FCN源码分析
softmax_loss_ohem_layer.cu#include #include #include #include "caffe/layers/softmax_loss_ohem_layer.hpp"#include "caffe/util/math_functions.hpp"namespace caffe {template __global__ void原创 2017-01-05 16:41:52 · 6933 阅读 · 0 评论 -
目标检测之CNN系列
排行榜pascal VOC:http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.phpcoco:http://mscoco.org/dataset/#detections-leaderboardkitti:http://www.cvlibs.net/datasets/kitti/eval_object.phpRegionlets ...原创 2016-06-20 08:33:56 · 12189 阅读 · 1 评论 -
visual attention
模型汇总24 - 深度学习中Attention Mechanism详细介绍:原理、分类及应用RAM论文笔记之: Recurrent Models of Visual AttentionRecurrent Visual Attention源码解读论文笔记之:Multiple Object Recognition With Visual Attention论文笔记之:Attention For Fin...原创 2017-11-10 11:22:57 · 1182 阅读 · 0 评论 -
图像语义分割
从特斯拉到计算机视觉之「图像语义分割」关于图像语义分割的总结和感悟FCNN: Fully Convolutional Networks for Semantic SegmentationDeeplab: Semantic Image Segmentation with Deep Convolutional Nets and Ful原创 2016-09-15 17:28:17 · 12037 阅读 · 0 评论 -
image caption
实时字幕生成原理挖掘——论文解读DenseCap: Fully Convolutional Localization Networks for Dense Captioning原创 2017-09-15 15:31:56 · 2065 阅读 · 0 评论 -
细粒度图像分析
关键词:fine grained classification论文阅读(1)--Fine-grained Image Classification by Exploring Bipartite-Graph Labels论文阅读(2)--Picking Deep Filter Responses for Fine-grained Image Recognition论文阅读(3)--SPDA-CNN:...原创 2017-05-13 19:07:10 · 2670 阅读 · 1 评论 -
tensorflow obeject detection
业界 | 谷歌开源TensorFlow Object Detection API物体识别系统谷歌开放的TensorFlow Object Detection API 效果如何?对业界有什么影响?Supercharge your Computer Vision models with the TensorFlow Object Detection API深度学习入门篇--原创 2017-07-18 19:50:39 · 703 阅读 · 0 评论 -
Hog行人检测
HOG特征向量归一化对block块内的HOG特征向量进行归一化。对block块内特征向量的归一化主要是为了使特征向量空间对光照,阴影和边缘变化具有鲁棒性。还有归一化是针对每一个block进行的,一般采用的归一化函数有以下四种:在人体检测系统中进行HOG计算时一般使用L2-norm,Dalal的文章也验证了对于人体检测系统使用L2-norm的时候效果最好。原创 2015-04-24 20:16:12 · 3159 阅读 · 0 评论 -
图像特征之SIFT
OpenCV2.4.4中调用SIFT特征检测器进行图像匹配利用RANSAC算法筛选SIFT特征匹配RobHess的SIFT源码分析:综述RobHess的SIFT源码分析:imgfeatures.h和imgfeatures.c文件RobHess的SIFT源码分析:kdtree.h和kdtree.c文件RobHess的SIFT源码分析:sift.h和sift原创 2016-09-12 16:01:24 · 2386 阅读 · 0 评论 -
Siamese 网络
深度学习(十六)基于2-channel network的图片相似度判别-CVPR 2015原创 2016-12-30 23:05:00 · 1641 阅读 · 0 评论 -
yolo源码分析
YOLO源码详解(一)-训练YOLO源码详解(二)- 函数剖析YOLO源码详解(三)- 前向传播(forward)YOLO源码详解(四)- 反向传播(back propagation)YOLO源码详解(五)- YOLO中的7*7个grid和RPN中的9个anchorsYOLO源码详解(五)-追本溯源7*7个grid用YOLOv2模型训练VOC数据集Y原创 2017-01-08 00:46:27 · 2289 阅读 · 0 评论 -
图像检索
BOW 原理及代码解析Bag of Features (BOF)图像检索算法原创 2016-10-14 15:50:53 · 3692 阅读 · 0 评论 -
行为识别
Reading papers_10(人体行为识别特征点提取小综述)Activity Recognition行为识别基于3D卷积神经网络的人体行为理解(论文笔记)视频中行为识别公开数据库汇总原创 2016-10-13 16:24:50 · 1831 阅读 · 0 评论 -
人脸识别之PCA
PCA人脸检测原创 2015-04-22 17:43:07 · 1837 阅读 · 0 评论 -
kalman跟踪的实现
#ifndef _KALMANFILTER_#define _KALMANFILTER_class CKalman{public: CKalman(int D, int M, int C); ~CKalman(); void KalmanPredict(double * control); void KalmanCorrect(double * measurement); voi原创 2016-01-21 21:37:54 · 10911 阅读 · 2 评论 -
Hough直线检测的原理与实现
标准直线Hough变换采用如下参数化直线方程:x*cosθ+y*sinθ=ρ (1)式中,θ表示直线的法线方向,0≤θ<180,ρ表示原点至直线的距离(本文中θ的单位均为“度”,ρ的单位均为“像素”)。通常在图像直线检测中不直接使用图像坐标系,而是使用原点在图像中心处、y轴方向与图像的y 方向相反的正交坐标系,如图1所示的Oxy坐标系。为了进原创 2014-12-04 23:38:57 · 8444 阅读 · 2 评论 -
肤色识别
肤色作为人的体表显著特征之一,尽管人的肤色因为人种的不同有差异,呈现出不同的颜色,但是在排除了亮度和视觉环境等对肤色的影响后,皮肤的色调基本一致,这就为利用颜色信息来做肤色分割提供了理论卜的依据。在肤色识别中,常用的颜色空间为YCbCr颜色空间。在YCbCr颜色空间中,Y代表亮度,Cb和Cr分别代表蓝色分量和红色分量,两者合称为色彩分量。YCbCr颜色空间具有将色度与亮度分离的特点,在YCbC原创 2015-05-24 16:59:05 · 7052 阅读 · 0 评论 -
双边滤波器、高斯滤波
普通的高斯滤波会将图像的边缘模糊掉,而双边滤波器具有保边特性。#define MAX_IMAGE_SIZE 1024double d[MAX_IMAGE_SIZE][MAX_IMAGE_SIZE];//d[i][j]表示入图像,fi][j]表示出图像。double f[MAX_IMAGE_SIZE][MAX_IMAGE_SIZE];void CImageColorProcess::Bi原创 2015-03-16 15:41:36 · 6967 阅读 · 0 评论 -
基于mean shift的图像分割
1 mean shift算法Mean Shift 这个概念最早是由Fukunaga 等人[1]于1975 年在一篇关于概率密度梯度函数的估计中提出来的,其最初含义正如其名,就是偏移的均值向量,在这里Mean Shift 是一个名词,它指代的是一个向量,但随着Mean Shift 理论的发展,Mean Shift 的含义也发生了变化,如果我们说Mean Shift 算法,一般是指一个迭代的步骤,原创 2015-04-22 16:40:18 · 17555 阅读 · 4 评论 -
Gabor的OpenCV代码
转自http://blog.youkuaiyun.com/guoming0000/article/details/7839917最近弄人脸识别,用到Gabor卷积核,但网上的代码似乎没有和我心意的,于是参考了自己写了下!参考了Zhou Mian以及matlab的Gabor实现代码的代码。虽然OpenCV的imporc下面有个gabor.cpp,但那个是一般形式的公式,不是用来做人脸识别的,可以参考转载 2015-06-22 23:17:07 · 1277 阅读 · 0 评论 -
DoG 、Laplacian、图像金字塔详解
转自:http://blog.youkuaiyun.com/yangtrees/article/details/8309594DoG(Difference of Gaussian)DoG (Difference of Gaussian)是灰度图像增强和角点检测的方法,其做法较简单,证明较复杂,具体讲解如下:Difference of Gaussian(DOG)是高斯函数的差分。转载 2015-06-22 22:27:42 · 1175 阅读 · 0 评论 -
用cnn做行人分类
机器学习数据库是关键,自己搜搜吧,规模太小训练不出来,正样本和负样本。训练之前要处理训练文件,这个我在之前的python图像操作这篇博文里写过,并有完整代码。也可以用我处理好的数据,稍后我会上传input_data.py"""Functions for downloading and reading MNIST data."""from __future__ import原创 2016-05-12 18:31:24 · 2205 阅读 · 2 评论 -
SLIC超像素(superpixel)算法
SLIC算法是simple linear iterative cluster的简称,该算法用来生成超像素(superpixel)。基本思想算法大致思想是这样的,将图像从RGB颜色空间转换到CIE-Lab颜色空间,对应每个像素的(L,a,b)颜色值和(x,y)坐标组成一个5维向量V[L,a,b,x,y],两个像素的相似性即可由它们的向量距离来度量,距离越大,相似性越小。算法首先生原创 2015-03-24 10:29:28 · 30169 阅读 · 9 评论 -
目标跟踪之Lukas-Kanade光流法
光流是图像亮度的运动信息描述。光流法计算最初是由Horn和Schunck于1981年提出的,创造性地将二维速度场与灰度相联系,引入光流约束方程,得到光流计算的基本算法.光流计算基于物体移动的光学特性提出了2个假设:①运动物体的灰度在很短的间隔时间内保持不变;②给定邻域内的速度向量场变化是缓慢的。算法原理假设图像上一个像素点(x,y),在t时刻的亮度为E(x+Δx,y+Δy,t+原创 2015-06-25 16:58:29 · 68169 阅读 · 18 评论 -
人脸识别
人脸识别必读的N篇文章原创 2016-12-03 17:09:41 · 11399 阅读 · 1 评论 -
opencv笔记
OpenCV基础数据结构原创 2016-10-13 16:55:01 · 822 阅读 · 0 评论 -
目标跟踪之mean shift
Mean shift 算法是一种半自动跟踪方法在起始跟踪帧通过手工确定搜索窗口来选择运动目标计算核函数加权下的搜索窗口的直方图分布用同样的方法计算当前帧对应窗口的直方图分布以两个分布的相似性最大为原则使搜索窗口沿密度增加最大的方向移动目标的真实位置。加权直方图传统直方图仅仅统计落入直方图区间的像素的个数,而加权直方图进一步考虑了像素与目标中心的距离,远离目标中心的像素对直方图的贡献较小原创 2015-06-28 10:59:31 · 5184 阅读 · 5 评论 -
目标检测之hough forest
Class-Specific Hough Forests for Object Detection原创 2015-10-27 23:42:22 · 2837 阅读 · 1 评论 -
haar+adaboost人脸检测
利用opencv自带的haar-cascade分类器检测,从已经训练好的xml文件加载模型,读入待检测图片,多尺度检测#include "opencv2/core/core.hpp" #include "opencv2/objdetect/objdetect.hpp" #include "opencv2/highgui/highgui.hpp"原创 2016-09-13 11:24:30 · 4191 阅读 · 0 评论 -
图像特征之Haar-Like特征
单个Harr-Like特征的分类能力是很弱的,但是通过特定的级联算法可以将简单Harr-Like特征应用于目标检测。原创 2015-04-22 18:12:34 · 11337 阅读 · 0 评论 -
图像特征之LBP
LBP 算子是一种有效的纹理描述算子, 它具有旋转不变性和灰度不变性等显著优点。其基本思想是用其中心像素的灰度值作为阈值,与它的邻域相比较得到的二进制码来表述局部纹理特征。基本LBP首先介绍LBP 算子的计算方式。对于一幅图像中的某个局部区域内的任意像素f(xc , yc ),以其为中心点gc , 对3 ×3 窗口内的8 个点g0 ,…, g7 , 纹理T 定义如下:以窗口原创 2015-05-17 14:14:14 · 9475 阅读 · 4 评论
分享