
计算机视觉
静默虚空
软件工程师,算法工程师
展开
-
计算机视觉基础1——视差与深度信息
资料来源:Robert Collins,CSE486, Penn State第8讲Stereo Vision深度信息感知是人类产生立体视觉的前提。生理过程一定是相当复杂,此处,我们只从物理角度,并采用数学的方法来讨论。Inferring depth from images taken at the same time by two or more cameras. 基本透视投影转载 2017-03-12 22:12:59 · 963 阅读 · 0 评论 -
在YOLO2中增加自己的物体识别
从RCNN, fast RCNN, 到faster RCNN, YOLO, 以及最新的YOLO2, 检测的速度是越来越快了, 最新的YOLO2据作者说可以达到67Fps, 支持的种类达9000.想看效果的请戳这里YOLO2 .这么快速度,当然很多人估计跟我一样,想把它用来检测特定类的物体。这里,我将根据自己查找的一些资料,以及自己的实践,告诉大家怎么在YOLO2中增加识别自己需要的物体。主转载 2017-06-21 22:16:28 · 6802 阅读 · 4 评论 -
基于OPENCV3的物体跟踪算法
在本教程中,我们将了解OpenCV 3.0中引入的OpenCV跟踪API。 我们将学习如何以及何时使用OpenCV 3.2中提供的6种不同的跟踪器- BOOSTING,MIL,KCF,TLD,MEDIANFLOW和GOTURN。 我们还将学习现代跟踪算法背后的基本理论。什么是对象跟踪?简单地说,在视频的连续帧中定位对象被称为跟踪。定义听起来很直接,但在计算机视觉和机转载 2017-06-20 14:59:11 · 18872 阅读 · 0 评论 -
图像特征提取三大法宝:HOG特征,LBP特征,Haar特征
(一)HOG特征1、HOG特征:方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOG+SVM进行行人检测的方法是法国研究人员Da转载 2017-06-06 15:10:19 · 674 阅读 · 0 评论 -
简单的制作标定板的程序
用来做双目或者单目的标定和校正,opencv实现static int board(){ int width = 210;//棋盘格宽度 int height = 210;//棋盘格高度 int x_num = 6;//角点数目 int y_num = 9;//角点数目 IplImage *src = cvCreateImage(cvS原创 2017-03-17 13:05:55 · 2833 阅读 · 0 评论 -
计算机视觉基础5——本质矩阵与基本矩阵(Essential and Fundamental Matrices)
回顾本质矩阵的定义 本质矩阵的基本性质:结合成像的几何关系 Longuet-Higgins equation注意大小写的区别哦,大小表示物点矢量,小与表示像点矢量。像平面上的一点可以看作:• (u,v) 2D film point(局限于像平面上来考虑)• (u,v,f) 3D point on film plane(相机坐标系中来考虑)转载 2017-03-22 22:18:40 · 474 阅读 · 0 评论 -
计算机视觉基础4——对极几何(Epipolar Geometry)
先思考一个问题:用两个相机在不同的位置拍摄同一物体,如果两张照片中的景物有重叠的部分,我们有理由相信,这两张照片之间存在一定的对应关系,本节的任务就是如何描述它们之间的对应关系,描述工具是对极几何 ,它是研究立体视觉的重要数学方法。 要寻找两幅图像之间的对应关系,最直接的方法就是逐点匹配,如果加以一定的约束条件对极约束(epipolar constraint),搜索的范围可以大大减小。转载 2017-03-22 22:17:34 · 942 阅读 · 0 评论 -
计算机视觉基础3——内部参数描述
在上一节中,我们用矩阵描述了外部参数,即物体的坐标到相机坐标的变换。同时还分析了透视投影,即成像的过程,整个过程就是从(U,V,W)->(X,Y,X)->(x,y)。这一节主要讨论如何从像平面(x,y)变换到数字图像(u,v),即从像平面(Film Coords)到像素(Pixel Coords)。对一幅数字图像,我们可以改变它的宽高比,即作尺度变换。将尺度变换与透视投影结转载 2017-03-12 22:17:17 · 366 阅读 · 0 评论 -
计算机视觉基础2——相机成像的几何描述
试想像一下,很多游客同时在不同角度拍摄Eiffel Tower(埃菲尔铁塔),该如何用数学的方法来描述这一过程呢?首先要解决的问题就是定位,或者说坐标选定的问题,埃菲尔铁塔只有一座,如果按经、纬度来刻画,它的坐标是唯一确定的,但游客显然不关系这一点,他(她)只按自己的喜好选择角度和位置,因此,物体(景物)有物体的坐标系统,相机有相机的坐标系统,即便同一个相机,当调整参数时,在同样的位置、相同的角度转载 2017-03-12 22:15:11 · 587 阅读 · 0 评论 -
OpenCV+python手势识别框架和简单例子
基于OpenCV2.4.8和 python 2.7实现简单的手势识别。以下为基本步骤1.去除背景,提取手的轮廓2. RGB->YUV,同时计算直方图3.进行形态学滤波,提取感兴趣的区域4.找到二值化的图像轮廓5.找到最大的手型轮廓6.找到手型轮廓的凸包7.标记手指和手掌8.把提取的特征点和手势字典中的进行比对,然后判断手势和形状提取手的轮廓原创 2017-08-01 10:28:58 · 27773 阅读 · 37 评论