
machine vision
文章平均质量分 65
lxiaoxiaot
这个作者很懒,什么都没留下…
展开
-
adaBoost
<br /> <br /> <br />Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器融合起来,作为最后的决策分类器。使用级联的adaboost分类器可以排除一些不必要的训练数据特征,并将关键放在关转载 2010-12-03 13:57:00 · 2923 阅读 · 1 评论 -
关于静态图像生成句子描述的问题
<br /><br />进入Computer Vision领域以来,很久之前就有个想法,能否给计算机一幅照片,计算机能够自动的描述图像中的内容,甚至图像中的人物以及正在发生的事情。就像是咱们小时候的看图作文似的。<br />自己也思考了很长时间,没有好的思路,里面涉及很多基本的问题没有被解决,像是Image Segmentation、Object Detection、Action Classification、Scene Classification以及NLP的一些问题。设计到的问题太多了。<br />但是转载 2011-04-22 23:22:00 · 1391 阅读 · 0 评论 -
多维对象的元素矩阵在内存中的分布、opencv
为了高效的获取矩阵形式存在的多维对象中的元素,就需要知道其在内存中是如何分布的。 注意:矩阵格式的不同,其在内存中的分布方式也就不同。 例如,使用矩阵存储n个三维点,有如下四种可能的方式: 1、n 行 1 列,3 通道; 2、1 行 n 列,3 通道; 3、n 行 3 列,1 通道; 4、3 行 n 列,1 通道;转载 2011-06-19 21:46:00 · 1941 阅读 · 0 评论 -
归一化RGB
通过对图像的RGB色彩空间进行归一化处理,在某些情况下是去除光照和阴影影响的一种简单和有效的方法。 假设RGB代表原图像某点的像素值,rgb表示归一化之后的值,则 r = R / (R+G+B);g = G / (R+G+B);b = B / (R+G+B); 实现归一化RGB的方法如下: // 对输入的原始RGB图像获取对应的归一化图像IplImage* Normal原创 2011-06-19 23:35:00 · 11797 阅读 · 3 评论 -
OpenCV2.3即将出炉
OpenCV开发小组的成员们真是努力呀,OpenCV2.3的Release Candidate于今天发布,SourceForge上面http://sourceforge.net/projects/opencvlibrary/,也提供了2.3.0rc源代码的下载链接。 主要的改动如下: 1、不在使用LAPACK库来进行基本的数学运算了,转而使用开发小组人员自己编写的Jacobi SVD。在原创 2011-06-22 10:33:00 · 3184 阅读 · 2 评论 -
cvGet?D与cvSet?D
cvGet?D用于获取数组中指定下标的元素值,cvSet?D用于为数组中指定下标的元素赋予值。 以cvGet2D和cvSet2D为例: CvScalar cvGet2D (const CvArr * arr, int idx0, int idx1); void cvSet2D (const CvArr * arr, int idx0, int idx1, CvScalar valu原创 2011-06-19 21:07:00 · 8653 阅读 · 2 评论 -
彩色图像透明直方图显示
对视频流中的图像数据,提取其R、G、B分量值,生成彩色直方图,并设置直方图的透明度,将其显示在原图像上。 需要用到的关键方法如下:1、将输入的直方图数据绘制在初始分辨率为256*64的图像上,图像大小可自行调整 // draw the histogramIplImage* DrawHistogram(CvHistogram *hist, float scaleX = 1, flo转载 2011-06-19 19:41:00 · 2357 阅读 · 0 评论 -
基于热映像的图像分割算法
期待今年CVPR上的好文章。 本报讯据美国每日科学网6月21日报道,美国普渡大学的研究人员开发出一种基于热映像的计算机图像分割算法,可使计算机迅速识别出物体的外形,即便其发生扭曲或轻度变形也不会受到影响。该技术将使机器视觉与人类视觉更加接近,可广泛应用于图像搜索、医疗影像以及无人机制造等多个领域。详细研究结果将分为两篇论文,在6月21日至23日举行的IEEE(美国电气及电子工程师学会)转载 2011-06-22 23:28:00 · 1354 阅读 · 0 评论 -
里程计、推算定位与视觉里程计
以下内容翻译自wiki百科。里程计(Odometry):原文链接在此:http://en.wikipedia.org/wiki/Odometry里程计是一种利用从移动传感器获得的数据来估计物体位置随时间的变化而改变的方法。该方法被用在许多种机器人系统(轮式或者腿式翻译 2011-09-15 23:39:36 · 34543 阅读 · 2 评论 -
编译PTAM与PTAMM-记
编译PTAM,弄了一天,终于搞定了。记录一下。 平台说明:Windows XP, VS2008首先编译libCVD库:1、依赖toon库,toon作为一个头文件包包含进工程include目录即可;2、toon/internal/config.hh 只保留#define TOON_USE_LAPACK 1这一项即可;(使用lapack和Blas的/MT选项的库,^_^)3、删除l原创 2011-02-26 14:25:00 · 28387 阅读 · 67 评论 -
C/C++中使用GnuPlot
在C/C++程序中通过创建管线,使用GnuPlot实现实时绘图。 例子代码如下:#include int main(){ FILE* gp; #ifdef WIN32 gp = _popen("gnuplot -persist", "w");#else gp = popen("gnuplot -persist", "w");#endif if转载 2011-06-12 21:11:00 · 8908 阅读 · 1 评论 -
计算不规则图形的重心,OpenCV
不规则区域的矩,表示把一个归一化的灰度级图像函数理解为一个二维随机变量的概率密度。 这个随机变量的属性可以用统计特征--矩(Moments)来描述。通过假设非零的像素值表示区域,矩可以用于二值或灰度级的区域描述。 Mpq = sigma(i)sigma(j) ip jq f(i,j) 其中x,y,i,j是区域点的坐标(在数字图像中的像素坐标)。 令Xc,Yc表示区域重心的坐标,则原创 2011-06-12 19:22:00 · 24010 阅读 · 1 评论 -
OpenCV2.2的新特性(翻译)
<br /> <br />总体修改和改进:重新组织库结构,用较详细,更小的模块来取代cxcore, cv, cvaux, highgui 和 ml库opencv_core – core函数库(基本的结构,架构和线性代数,DFT,xml 和yam i/o接口函数等)opencv_imgproc -图像处理函数库(滤波,高斯模糊,形态学膨胀/腐蚀,线性缩放图像大小,图像几何变化,颜色结构变化,计算直方图等)opencv_highgui – GUI,图像和视频接口函数库opencv_ml -统计机器学习模型函转载 2010-12-23 13:53:00 · 1834 阅读 · 0 评论 -
在Windows环境下使用opencv2.2的python绑定
<br />使用VS2008编译OpenCV2.2,在F:/CV/OpenCV/OpenCV-2.2.0/Build/Python2.6/Lib/site-packages目录下,<br />生成cv.lib和cv.pyd两个文件。<br />1、 将F:/CV/OpenCV/OpenCV-2.2.0/Build/bin添加到系统环境变量中;<br />2、 将cv.lib 和 cv.pyd文件拷贝到python安装路径下的E:/programs/Python2.6.5/Lib/site-packages目转载 2010-12-23 14:16:00 · 1658 阅读 · 0 评论 -
Windows下使用VS2008编译RobotVision库
<br /><br />1、按照OpenSlam.org网站上给出的RobotVision_install_guide.txt,下载Toon、libcvd、opencv2.1和CSparse库;<br />2、Toon用作函数库,将其头文件包含进IDE的inlucde路径即可;<br />3、将libcvd按照/MD(/MDd)开关进行编译;<br />4、将CSparse的头文件和源文件拷贝到RobotVision对应的CSparse目录下;<br />5、安装Opencv2.1库;<br />6、配置好原创 2011-03-12 22:58:00 · 2924 阅读 · 0 评论 -
2010年图灵奖
<br />计算机协会(ACM)宣布,2010年度图灵奖授予了在开发机器学习理论等方面有基础性贡献的英国计算机理论学家、哈佛大学教授 Leslie Valiant,奖金为25万美元。ACM称,Valiant在机器学习,计算复杂度理论,并行和分布式计算等领域都有突出贡献,推动了人工智能技术的发展。在Valiant之前,有很多人在研究机器学习,也取得了不俗的贡献,但一个基础问题始终没有攻破——如何处理错误。当时的机器学习能执行阳性结果和阴性结果,对超过样本局限之外的情况无法自我发挥,系统无法处理不可避免的错误。转载 2011-03-13 10:26:00 · 2160 阅读 · 0 评论 -
R语言的图形用户界面
<br />R是一种面向统计学的开源编程语言和软件环境,它由语言,以及带调试器、绘图、系统函数访问和脚本的运行时环境组成。R语言在统计软件开发领域十分 受欢迎,也是数据挖据的重要分析工具。R语言是贝尔实验室开发的S语言的一个实现。统计学家使用R多是通过命令行,但对于刚刚起步的新手来说命令行太复杂 了,幸运的是,有许多图形用户界面可以让学习曲线变得更平些。<br /><br />Linuxlinks的这篇文章收集了七款优秀的R语言图形用户界面,帮助初学者快速进入R语言环境。包括:集成开发环境RStudio,G转载 2011-03-25 10:38:00 · 5666 阅读 · 0 评论 -
什么是图像特征
什么是图像特征,并没有一个准确的定义。计算机视觉中通常把角点(corner)作为是图像的特征,而角点能够作为图像特征点的原因有以下两点:1、角点具有唯一的可识别性,当然,这是基于两幅图像没有非常大的差别的前提下适用的;2、角点具有稳定性,换句话说,就是当该点有微小的运动时,就会产生明显的变化。于是,可以清晰的看到该点的移动,这有利于特征点的跟踪;对于图像上其它的特征描述,如边(edge),区域(patch)等,用数学的语言来描述,就是,这些特征点变化性比较小。如某一灰度相似的区域,其一阶导数为常数,二阶导数转载 2011-04-07 21:53:00 · 8670 阅读 · 1 评论 -
从RGB色转为灰度色算法
<br />一、基础 <br /> 对于彩色转灰度,有一个很著名的心理学公式:<br /> Gray = R*0.299 + G*0.587 + B*0.114<br />二、整数算法<br /> 而实际应用时,希望避免低速的浮点运算,所以需要整数算法。<br /> 注意到系数都是3位精度的没有,我们可以将它们缩放1000倍来实现整数运算算法:<br /> Gray = (R*299 + G*587 +转载 2011-04-07 21:08:00 · 3229 阅读 · 0 评论 -
使用videoInput获取图像数据
OpenCV2.0之后的版本中提供了第三方库videoInput,它实现了windows平台下对DirectShow的封装,相比于直接使用VFW,效率要高出很多。 配置依赖库路径:$/OpenCV2.1/3rdparty/include $/OpenCV2.1/3rdparty/lib // 初始化videoInput对象,并设置图像捕捉设备 videoInput vi;原创 2011-06-12 10:37:00 · 5244 阅读 · 1 评论 -
OpenCV绘图
转自:http://www.shervinemami.co.cc/graphs.html在OpenCV程序中,使用第三方库graphUtils对通过计算得到的结果数据进行可视化操作。graphUtils的实现依赖OpenCV库。其主要功能包括:1、在新窗口中将一维数组中的数据可视化;(支持的数据类型包括:float, int, uchar)2、在新建的IplImage上显示多组数据转载 2011-06-12 22:28:00 · 5081 阅读 · 0 评论 -
Computer Vision如何学习,前景怎样?
Computer Vision的尴尬Computer Vision是AI的一个非常活跃的领域,每年大会小会不断,发表的文章数以千计(单是CVPR每年就录取300多,各种二流会议每年的文章更可谓不计其数),新模型新算法新应用层出不穷。可是,浮华背后,根基何在?对于Vision,虽无大成,但涉猎数年,也有管窥之见。Vision所探索的是一个非常复杂的世界,对于这样的世界如何建模,如转载 2011-12-14 14:09:55 · 4646 阅读 · 0 评论