- 博客(12)
- 资源 (1)
- 收藏
- 关注
原创 计算机视觉:图像分割
一、算法介绍Graph Cut(图形切割)应用于计算机视觉领域用来有效的解决各种低级计算机视觉问题,例如图像平滑(image smoothing)、立体应对问题(stereo correspondence problem)、图像分割(image segmentation)等等。此类方法把图像分割问题与图的最小割(min cut)问题相关联,在计算机视觉的很多类似的问题中,最小能量(minimum...
2019-06-11 15:11:44
716
转载 计算机视觉:mnist手写体数字识别
一、mnist数据描述MNIST数据集是28×28像素的灰度手写数字图片,其中数字的范围从0到9具体如下所示(参考自Tensorflow官方文档):二、原理 受Hubel和Wiesel对猫视觉皮层电生理研究启发,有人提出卷积神经网络(CNN),Yann Lecun 最早将CNN用于手写数字识别并一直保持了其在该问题的霸主地位。近年来卷积神经网络在多个方向持续发力,在语音识别、人脸识别、...
2019-06-02 22:52:52
2079
原创 计算机视觉:图像内容分类
一、图像内容分类1.1 图像识别的难点图像识别看似很直接。但实际上包含很多挑战,人类可是经过数亿年的进化才获得如此强大的大脑,对于各种物体有着精准的视觉理解力。总体而言,我们想『教』会计算机去认识一类图,会有下面这样一些困难:视角不同,每个事物旋转或者侧视最后的构图都完全不同尺寸大小不统一,相同内容的图片也可大可小变形,很多东西处于特殊的情形下,会有特殊的摆放和形状光影等干扰/幻象背...
2019-05-19 22:12:48
441
原创 计算机视觉:多视几何——基础矩阵原理
一、基础矩阵原理介绍1、对极几何本质上两幅图之间的对极几何是图像平面与以基线为轴的平面束的交的几何,这种几何被广泛同于双目成像原理中如图所示,摄像机由相机中心C,C’以及各自的成像平面表示,对于任意一个空间中的点X,在两个像平面上的点分别为x,x’,第一幅图像上的点x反向投影成空间三维的一条射线,它由摄像机中心和x确定,这条射线向第二个图像平面上投影得到一条直线l’,显然x的投影x’必然在...
2019-04-17 21:06:03
1151
原创 计算机视觉实验五:标定相机参数
相机需要标定的参数通常分为内参和外参两部分。外参确定了相机在某个三维空间中的位置和朝向,如:旋转、平移;旋转矩阵和平移矩阵共同描述了如何把点从世界坐标系转换到摄像机坐标系。至于内参,可以说是相机内部的参数,如:相机焦距、畸变系数、像主点坐标下面给出了内参矩阵,需要注意的是,真实的镜头还会有径向和切向畸变,而这些畸变是属于相机的内参的。摄像机内参矩阵: fx s x0K...
2019-04-14 15:55:41
2208
原创 Python+OpenGL实现增强现实
一、实现增强现实1、什么是增强现实?增强现实(Augmented Reality,简称AR)。增强现实技术,它是一种将真实世界信息和虚拟世界信息“无缝”集成的新技术,是把原本在现实世界的一定时间空间范围内很难体验到的实体信息(视觉信息,声音,味道,触觉等),通过电脑等科学技术,模拟仿真后再叠加,将虚拟的信息应用到真实世界,被人类感官所感知,从而达到超越现实的感官体验。真实的环境和虚拟的物...
2019-04-06 11:32:37
2939
1
原创 Python实验四:全景拼接
一、全景拼接原理介绍全景视图是指在一个固定的观察点,能够提供水平方向上方位角360度,垂直方向上180度的自由浏览,简化的全景只能提供水平方向360度的浏览。通常全景图像的获得有两种方法:全景拍摄和通过图像拼接来获得全景图像。前者需要特殊的设备,但是操作起来非常方便,简单易行,但是,这种设备价格非常昂贵,不适合普及。后者只需要普通的相机就可,但是需要进行相应的图像投影和拼接,所谓图像投影是指...
2019-03-31 23:23:04
2457
原创 Python实验三:图像中的图像
一、原理介绍单应性变换是将一个平面内的点映射到另个平面内的二维投影变换。平面是指图像或者三维中的平面表面。单应性矩阵(Homography)就是一个从一张图像到另一张图像映射关系的转换矩阵(3*3)。可以由下面的公式来表示:可以将单应性变换写成如下形式:二、Alpha原理在图形学中,ALPHA指的是除了颜色的三个分量(RGB)外 的第四个分量:透明度。所以,一个真彩色(指利用RG...
2019-03-19 21:34:14
370
原创 Python实验二:SIFT特征原理及特征匹配
一、SIFT算法原理概述 1、SIFT算法概述 尺度不变特征转换即SIFT (Scale-invariant feature transform)是一种计算机视觉的算法。它用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,此算法由 David Lowe在1999年所发表,2004年完善总结。 其应用范围包含物体辨识、机器人地图感知与导航、影像缝合、...
2019-03-17 22:52:03
1250
原创 Python实验一:图像基础处理
python——图片基础处理安装完python,配置好OpenCV,开始Python之旅。1.图像处理   1.1读取图片,输出图片font = FontProperties(fname=r"c:\windows\fonts\SimSun.ttc", size=14)im = array(Image.open('D:/1.jpg'))
2019-03-06 21:35:57
2452
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人