
Computer Vision
随遇而安随缘一世
这个作者很懒,什么都没留下…
展开
-
[数据分析基础] MNI与Talairach坐标系的转换
对于初学者这是个令人头疼的问题。标准太多,无所适从,什么时候大家有空来开个会给统一下吧:cacakiki3:近期搜罗一下相关资料,感觉这个也许是当前最好的解决方案了吧?欢迎大家指正和补充。In the past, BrainMap has utilized the Brett transform to convert MNI coordinates to Talairach转载 2013-05-18 19:18:09 · 5718 阅读 · 0 评论 -
Bag of Features (BoF) 简介
最初的Bag of words,也叫做“词袋”,在信息检索中,Bag of words model假定对于一个文本,忽略其词序和语法,句法,将其仅仅看做是一个词集合,或者说是词的一个组合,文本中每个词的出现都是独立的,不依赖于其他词是否出现,或者说当这篇文章的作者在任意一个位置选择一个词汇都不受前面句子的影响而独立选择的。 现在Computer Vision中的Bag of wor转载 2013-05-20 09:36:55 · 5815 阅读 · 0 评论 -
SIFT算法详解
尺度不变特征变换匹配算法详解Scale Invariant Feature Transform(SIFT)Just For Funzdd zddmail@gmail.com对于初学者,从David G.Lowe的论文到实现,有许多鸿沟,本文帮你跨越。1、SIFT综述尺度不变特征转换(Scale-invariant feature trans转载 2013-05-20 09:30:25 · 1298 阅读 · 1 评论 -
Tutorials - kd-tree
VLFeat implements the randomized kd-tree forest from FLANN. This enables fast medium and large scale nearest neighbor queries among high dimensional data points (such as those produced by SIFT).转载 2013-05-20 10:44:50 · 1554 阅读 · 0 评论 -
RGB16转换RGB24
在视频采集和视频的编解码中,常出现RGB16的数据格式,而我们最常用是图像处理数据格式为RGB24。他们之间需要转换,整理如下:RGB16数据像数数据格式有二种: (1)RGB565 每个像素用16位表示,RGB分量分别使用5位、6位、5位 (2)RGB555 每个像素用16位表示,RGB分量都使用5位(剩下的1位不用)转载 2013-05-12 01:34:57 · 1005 阅读 · 0 评论 -
颜色空间转换(二)
颜色空间转换 接《颜色空间转换(一)》一文(http://blog.youkuaiyun.com/juyingmin/archive/2010/06/23/5689591.aspx)4,XYZ颜色空间 国际照明委员会(CIE)在进行了大量正常人视觉测量和统计,1931年建立了"标准色度观察者",从而奠定了现代CIE标准色度学的定量基础。由于"标准色度观察者"用来标转载 2013-05-12 01:34:02 · 1468 阅读 · 0 评论 -
颜色空间转换(一)
颜色空间转换 不同彩色空间之间的转换。1,CMY/CMYK颜色空间 青、品红、黄(CMY)(Cyan、Magenta、Yellow)彩色模型是彩色图象印刷行业使用的彩色空间,在彩色立方体中它们是红、绿、蓝的补色,称为减色基,而红、绿、蓝称为加色基。在CMY模型中,颜色是从白光中减去一定成分得到的。CMY坐标可以从RGB模型中得到:转载 2013-05-12 01:32:55 · 902 阅读 · 0 评论 -
图像的各种色彩空间
RGB 是一个通过与亮度有关的红色(Red)、绿色(Green)和蓝色(Blue)的组合来表现色彩,RGB模型基于色彩的相加,当R、G、B三种色彩的亮度都达到最大值时,得到的结果是白色,图像经扫描时大多用这种色彩模型,并且,RGB色彩模型同时是用来描述从显示器的红色、绿色和蓝色磷光粉中发出的能量数值的指定技术。RGB色彩模型是根据人眼锥体按收光线的方式构成一个模型的,眼睛的锥体转载 2013-05-12 01:26:11 · 1320 阅读 · 0 评论 -
和机器学习和计算机视觉相关的数学之一
(以下转自一位MIT牛人的空间文章,写得很实际:)作者:Dahua感觉数学似乎总是不够的。这些日子为了解决research中的一些问题,又在图书馆捧起了数学的教科书。从大学到现在,课堂上学的和自学的数学其实不算少了,可是在研究的过程中总是发现需要补充新的数学知识。Learning和Vision都是很多种数学的交汇场。看着不同的理论体系的交汇,对于一个researcher来说,往往是转载 2013-05-08 12:16:07 · 606 阅读 · 0 评论 -
机器学习知识点学习
在学习机器学习的有关知识时,搜索到JerryLead的cnblog中的Machine Learning专栏,里面对于机器学习的部分算法和知识点讲解地很经典和透彻。所以Mark在这,多多学习!http://www.cnblogs.com/jerrylead/tag/Machine%20Learning/ 偏最小二乘法回归(Partial Least Squares Regressio转载 2013-05-08 12:15:18 · 640 阅读 · 0 评论 -
简单粗糙的指尖检测方法(FingerTips Detection)
在人机交互领域,如果可以比较好的检测指尖,对于交互的丰富度、灵活性来说是有很大提升的。目前指尖检测的方法也很多,我这里稍微尝试了下简单了两种。这两种方法都借助了手的几何特征,简单但比较粗糙,鲁棒性不够。 方法一:重心距离法 见下图,红色点是手的重心,那么手的边缘的所有点与重心点的距离按顺时针方向或者逆时针方向遍历,就会出现五个峰值,分别是五个手指,这样我们就可以简单找到了转载 2013-05-08 12:14:09 · 915 阅读 · 0 评论 -
图像分割之(三)从Graph Cut到Grab Cut
上一文对GraphCut做了一个了解,而现在我们聊到的GrabCut是对其的改进版,是迭代的Graph Cut。OpenCV中的GrabCut算法是依据《"GrabCut" - Interactive Foreground Extraction using Iterated Graph Cuts》这篇文章来实现的。该算法利用了图像中的纹理(颜色)信息和边界(反差)信息,只要少量的用户交互操作即转载 2013-05-08 11:57:24 · 1338 阅读 · 0 评论 -
图像分割之(二)Graph Cut(图割)
上一文对主要的分割方法做了一个概述。那下面我们对其中几个比较感兴趣的算法做个学习。下面主要是Graph Cut,下一个博文我们再学习下Grab Cut,两者都是基于图论的分割方法。另外OpenCV实现了Grab Cut,具体的源码解读见博文更新。接触时间有限,若有错误,还望各位前辈指正,谢谢。 Graph cuts是一种十分有用和流行的能量优化算法,在计算机视觉领域普遍应用转载 2013-05-08 11:56:28 · 1595 阅读 · 0 评论 -
图像分割之(一)概述
所谓图像分割指的是根据灰度、颜色、纹理和形状等特征把图像划分成若干互不交迭的区域,并使这些特征在同一区域内呈现出相似性,而在不同区域间呈现出明显的差异性。我们先对目前主要的图像分割方法做个概述,后面再对个别方法做详细的了解和学习。1、基于阈值的分割方法 阈值法的基本思想是基于图像的灰度特征来计算一个或多个灰度阈值,并将图像中每个像素的灰度值与阈值相比较,最后将像素根据比较转载 2013-05-08 11:55:37 · 960 阅读 · 0 评论 -
目标检测的图像特征提取之(三)Haar特征
1、Haar-like特征 Haar-like特征最早是由Papageorgiou等应用于人脸表示,Viola和Jones在此基础上,使用3种类型4种形式的特征。Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。例转载 2013-05-08 11:53:56 · 850 阅读 · 0 评论 -
目标检测的图像特征提取之(一)HOG特征
1、HOG特征: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中获得了极大的成功。需要提醒的是,HOG+SVM进行行人检测的方法是法国研究人员Dal转载 2013-05-08 11:51:22 · 911 阅读 · 1 评论 -
目标检测的图像特征提取之(二)LBP特征
LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäinen,和 D. Harwood 在1994年提出,用于纹理特征提取。而且,提取的特征是图像的局部的纹理特征; 1、LBP特征的描述 原始的LBP算子定义为在3*3的转载 2013-05-08 11:47:57 · 910 阅读 · 0 评论 -
关于图像特征提取
网上发现一篇不错的文章,是关于图像特征提取的,给自己做的项目有点类似,发出来供大家参考。 特征提取是计算机视觉和图像处理中的一个概念。它指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。 特征的定义 至今为止特征没有万能和精确的定义。转载 2013-05-08 03:28:25 · 916 阅读 · 0 评论 -
Quantization
Quantization refers to the process of approximating the continuous set of values in the image data with a finite (preferably small) set of values. The input to a quantizer is the original data, and th转载 2013-05-08 03:06:18 · 861 阅读 · 0 评论 -
DICOM开发工具总结
网上流行的DICOM协议开发工具: 1、DICOM开发类库主要有:(1)、DCMTK(3.6.0), 官方下载网站,(如何安装编译DCMTK3.6.0)DCMTK实现了对DICOM图像存储、传输、图像显示所有操作.DCMTK提供了在各种操作系统下使用的可能版本,如LINUX、SUN、MACOS、WINDOWS等DCMTK开源项目,BSD licens转载 2013-05-08 01:52:29 · 2063 阅读 · 0 评论 -
DICOM
DICOM(Digital Imaging Communications in Medicine)标准是医学数字成像和通信的国际标准。DICOM虽然是在美国产生、发展的,但已被欧洲各国、日本等发达国家和地区接受,并被列入国家标准。在我国,DICOM是唯一被接受的医疗影像国际规范。DICOM已经成为国际医疗影像设备的图像通信/交流的唯一规范。DICOM标准逐渐得到国内外的高度重视,一些科研机构和高等转载 2013-05-08 00:06:23 · 1683 阅读 · 0 评论 -
用Matlab处理Dicom图像
最近在处理CT图像时,CT图像是对人体进行逐层扫描的,在图像有很多不需要的部分,比如肋骨部分就夹杂在里面,导致三维重建出来的图像有很多不需要的部分。很不好处理。 于是,我就想了了简单方法,对一张一张的dicom格式的图像,把里面不需要的像素点都置为黑色,这样就可以了。原打算用VC++6.0+VTK来实现的,调试起来太麻烦了,就直接用matlab来处理就简单了。1。读写Dico转载 2013-05-07 05:13:37 · 10696 阅读 · 1 评论 -
dicomsdl
dicomsdlDICOM Software Development Libraries Project HomeDownloadsSourceSummary People Project InformationProject feedsC转载 2013-05-07 04:51:49 · 1039 阅读 · 0 评论 -
纹理特征-LBP
纹理是物体表面的固有特征之一,可认为是灰度(颜色)在空间以一定的形式变化而产生的图案(模式).LBP(Local Binary Pattern, 局部二值模式)是一种用来描述图像局部纹理特征的算子;它的作用是进行特征提取,提取图像的局部纹理特征.原始的LBP算子定义为在3*3的窗口内,以窗口中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则转载 2013-02-12 14:03:54 · 727 阅读 · 0 评论 -
LBP纹理特征
LBP方法(Local binary patterns)是一个计算机视觉中用于图像特征分类的一个方法。LBP方法在1994年首先由T. Ojala, M.Pietikäinen, 和 D. Harwood 提出[43][44],用于纹理特征提取。后来LBP方法与HOG特征分类器联合使用,改善了一些数据集[45]上的检测效果。对LBP特征向量进行提取的步骤如下:首先将检测窗口划分为1转载 2013-02-12 14:05:20 · 773 阅读 · 0 评论 -
Graph cut
简介】Graph Cuts 不等于 graph cut(如 min cut、normalized cut、RatioCut), 是最近在计算机视觉中研究和应用比较多的energy minimization(能量函数最小化)优化算法,典型的用于stereo matching, image restortion, texture synthesis等应用。 这个优化算法用来解 markov转载 2013-05-28 08:04:51 · 1199 阅读 · 0 评论 -
Hough变换的线段检测
学习Hough变换过程中发现检测线段的算法资料不少,但实际能高效实现的不多。自己也在学习过程,水平问题只能提供思路和部分代码。 Hough变换的基本思想: Hough变换的基本思想就是点- 线的对偶性。它是对图像进行某种形式的坐标变换,将原始图像中给定形状的曲线或直线变换成空间中的一个点,在变换空间中形成峰值点。从而使检测整体特性变成检测局部特性,使问题简化。设在原转载 2013-05-12 01:37:03 · 1497 阅读 · 1 评论 -
浅析人脸检测之Haar分类器方法
一、Haar分类器的前世今生 人脸检测属于计算机视觉的范畴,早期人们的主要研究方向是人脸识别,即根据人脸来识别人物的身份,后来在复杂背景下的人脸检测需求越来越大,人脸检测也逐渐作为一个单独的研究方向发展起来。 目前的人脸检测方法主要有两大类:基于知识和基于统计。Ø 基于知识的方法:主要利用先验知识将人脸看作器官特征的组合,根据眼睛、眉毛、嘴巴、鼻子转载 2013-05-08 12:11:26 · 823 阅读 · 0 评论 -
计算机视觉目标检测的框架与过程
个人接触机器视觉的时间不长,对于机器学习在目标检测的大体的框架和过程有了一个初步的了解,不知道对不对,如有错误,请各位大牛不吝指点。 目标的检测大体框架:目标检测分为以下几个步骤:1、训练分类器所需训练样本的创建: 训练样本包括正样本和负样本;其中正例样本是指待检目标样本(例如人脸或汽车等),负样本指其它不包含目标的任意图片(如背转载 2013-05-08 12:09:41 · 663 阅读 · 0 评论 -
计算机视觉、机器学习相关领域论文和源代码大集合--持续更新……
注:下面有project网站的大部分都有paper和相应的code。Code一般是C/C++或者Matlab代码。最近一次更新:2013-3-17一、特征提取Feature Extraction:· SIFT [1] [Demo program][SIFT Library] [VLFeat]· PCA-SIFT [2]转载 2013-05-08 12:02:40 · 922 阅读 · 0 评论 -
图像分割之(五)活动轮廓模型之Snake模型简介
在“图像分割之(一)概述”中咱们简单了解了目前主流的图像分割方法。下面咱们主要学习下基于能量泛函的分割方法。这里学习下Snake模型简单的知识,Level Set(水平集)模型会在后面的博文中说到。 基于能量泛函的分割方法: 该类方法主要指的是活动轮廓模型(active contour model)以及在其基础上发展出来的算法,其基本思想是使用连续曲线来表达转载 2013-05-08 12:00:47 · 1960 阅读 · 0 评论 -
图像分割之(四)OpenCV的GrabCut函数使用和源码解读
上一文对GrabCut做了一个了解。OpenCV中的GrabCut算法是依据《"GrabCut" - Interactive Foreground Extraction using Iterated Graph Cuts》这篇文章来实现的。现在我对源码做了些注释,以便我们更深入的了解该算法。一直觉得论文和代码是有比较大的差别的,个人觉得脱离代码看论文,最多能看懂70%,剩下20%或者更多就需要转载 2013-05-08 11:59:14 · 1766 阅读 · 0 评论 -
GIST特征描述符使用
一种场景特征描述场景特征描述?通常的特征描述符都是对图片的局部特征进行描述的,以这种思路进行场景描述是不可行的。比如:对于“大街上有一些行人”这个场景,我们必须通过局部特征辨认图像是否有大街、行人等对象,再断定这是否是满足该场景。但这个计算量无疑是巨大的,且特征向量也可能大得无法在内存中存储计算。例如即使使用GIST进行1MB的图像数据搜索,也需要3.8GB的R转载 2013-02-12 14:34:34 · 4662 阅读 · 0 评论 -
目标检测的图像特征提取之(三)Haar特征
1、Haar-like特征 Haar-like特征最早是由Papageorgiou等应用于人脸表示,Viola和Jones在此基础上,使用3种类型4种形式的特征。Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。例转载 2013-02-12 14:32:06 · 2502 阅读 · 0 评论 -
目标检测的图像特征提取之(二)LBP特征
目标检测的图像特征提取之(二)LBP特征zouxy09@qq.com LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäinen, 和D. Harwood 在1994年提出,用于纹理特征提取。而且,提取的特征是图像的局部的纹转载 2013-02-12 14:30:49 · 778 阅读 · 0 评论 -
目标检测的图像特征提取之(一)HOG特征
目标检测的图像特征提取之(一)HOG特征zouxy09@qq.com1、HOG特征: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构成特征。Hog特征结合SVM分类器已经被广泛应用于图像识别中,尤其在行人检测中转载 2013-02-12 14:28:51 · 610 阅读 · 0 评论 -
SIFT 特征提取算法总结
SIFT(Scale-invariant feature transform)是一种检测局部特征的算法,该算法通过求一幅图中的特征点(interest points,or corner points)及其有关scale 和 orientation 的描述子得到特征并进行图像特征点匹配,获得了良好效果,详细解析如下:算法描述SIFT特征不只具有尺度不变性,即使改变旋转转载 2013-02-12 14:18:58 · 1052 阅读 · 0 评论 -
【OpenCV】SIFT原理与源码分析:DoG尺度空间构造
《SIFT原理与源码分析》系列文章索引:http://blog.youkuaiyun.com/xiaowei_cqu/article/details/8069548尺度空间理论自然界中的物体随着观测尺度不同有不同的表现形态。例如我们形容建筑物用“米”,观测分子、原子等用“纳米”。更形象的例子比如Google地图,滑动鼠标轮可以改变观测地图的尺度,看到的地图绘制也不同;还有电影中的拉转载 2013-06-12 01:27:04 · 966 阅读 · 0 评论 -
[CODE]UIUC同学Jia-Bin Huang收集的计算机视觉代码合集
UIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码,链接如下:https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html这些代码很实用,可以让我们站在巨人的肩膀上~~TopicResourcesReferencesFeat转载 2013-07-10 06:34:31 · 1157 阅读 · 0 评论 -
Color Conversion Algorithms
ContentsRGB to HSV & HSV to RGBRGB to YIQ & YIQ to RGBRGB to XYZ & XYZ to RGBXYZ to CIE L*a*b* (CIELAB) & CIELAB to XYZXYZ to CIELUV & CIELUV to XYZRGB to HSV & HSV to RGBThe Hue/Saturation/转载 2013-06-25 06:04:10 · 811 阅读 · 0 评论