
科研日志
JKhere
程序猿
展开
-
yuv和yCbCr的差异
一、和rgb之间换算公式的差异yuvrgbY'= 0.299*R' + 0.587*G' + 0.114*B'U'= -0.147*R' - 0.289*G' + 0.436*B' = 0.492*(B'- Y')V'= 0.615*R' - 0.515*G' - 0.100*B' = 0.877*(R'- Y')R' = Y' + 1.140*V'G' = Y' - 0.转载 2012-12-06 14:34:45 · 880 阅读 · 0 评论 -
关于焦距
一般我们说:焦距就是透镜中心到焦点的距离。但这仅仅是单片薄透镜的情况,由于照相机的镜头都是由许多片透镜组合而成的,因此,情况远不是那么简单。镜头的焦距分为像方焦距和物方焦距。像方焦距是像方主面到象方焦点的距离,同样,物方焦距就是物方主面到物方焦点的距离。必须注意,由于照相机镜头设计,特别是变焦距镜头中广泛采用了望远镜结构,物方焦距与像方焦距是不一定相等的。我们平时说的照相机镜头的焦距是指像方焦距。原创 2013-04-14 13:40:35 · 1709 阅读 · 0 评论 -
计算机视觉文献中常用名词解释
homography:翻译为单应性,单应性是几何中的一个概念。单应性是一个从实射影平面到射影平面的可逆变换,直线在该变换下仍映射为直线。原创 2013-04-27 10:12:43 · 1374 阅读 · 0 评论 -
A Brief Description of the Levenberg-Marquardt Algorithm Implemened by levmar
IntroductionThe Levenberg-Marquardt(LM) algorithm is an iterative technique that locates the minimum of a multivariate function that is expressed as the sum of squares of non-linear real-valued func翻译 2013-04-27 15:50:36 · 1627 阅读 · 0 评论 -
计算机视觉与图像处理、模式识别、机器学习学科之间的关系
在我的理解里,要实现计算机视觉必须有图像处理的帮助,而图像处理倚仗与模式识别的有效运用,而模式识别是人工智能领域的一个重要分支,人工智能与机器学习密不可分。纵观一切关系,发现计算机视觉的应用服务于机器学习。各个环节缺一不可,相辅相成。 计算机视觉(computervision),用计算机来模拟人的视觉机理获取和处理信息的能力。就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视转载 2013-07-15 15:20:25 · 1677 阅读 · 0 评论 -
下溢出
经常遇到的问题是下溢出,这是由于太多很小的数相乘造成的。当计算乘积时,由于大部分因子都非常小,所以程序会下溢出或者得到不正确的答案。(读者可以用Python尝试相乘许多很小的数,最后四舍五入后会得到0。)一种解决办法是对乘积取自然对数。在代数中有ln(a*b)=ln(a)+ln(b),于是通过求对数可以避免下溢出或者浮点数舍入导致的错误。同时,采用自然对数进行处理不会有任何损失。图给出函数f(x)原创 2013-07-17 16:00:15 · 2661 阅读 · 0 评论 -
关于高斯模糊的详细介绍及python代码实现
高斯模糊的算法 讲的很详细,值得仔细阅读!原创 2013-07-25 10:01:35 · 26972 阅读 · 6 评论 -
运动目标跟踪主流算法大致分类
运动目标跟踪主流算法大致分类不全,需要慢慢补充 一.运动目标检测 (一)背景差 1.帧差2.GMM 背景减算法可以对背景的光照变化、噪声干扰以及周期性运动等进行建模,在各种不同情况下它都可以准确地检测出运动目标。因此对于固定摄像头的情形,目前大多数的跟踪算法中都采用背景减算法来进行目标检测。背景减算法的局限性在于它需要一个静态的固定摄像头。原创 2013-10-16 17:52:38 · 5956 阅读 · 0 评论 -
matlab命令(应该很全了,欢迎补充!)
matlab命令一、常用对象操作:除了一般windows窗口的常用功能键外。1、!dir 可以查看当前工作目录的文件。 !dir& 可以在dos状态下查看。2、who 可以查看当前工作空间变量名, whos 可以查看变量名细节。3、功能键:功能键 快捷键 说明方向上键 Ctrl+P原创 2013-10-23 18:02:55 · 8113 阅读 · 0 评论 -
《SLIC Superpixels》阅读笔记
最近导师让我看看超像素方面的文章,就找到了这一篇比较有名的《SLIC Superpixels》。下面是简单的翻译和一些我的理解:摘要:超像素在计算机视觉领域越来越流行。但是,低计算量的算法却很少。我们发明了一种原创的算法,使像素聚类为五维颜色和图像层来生成简洁的,整齐的超像素。我们的研究非常简单易用,效率很高,具备很好的实用价值。实验证明我们的算法低计算消耗,但是却达到或者超过了其他4种最原创 2013-11-19 10:23:26 · 16686 阅读 · 12 评论 -
android SDK安装后设置环境变量
E:\My Studying\Android\android-sdk\platform-toolsE:\My Studying\Android\android-sdk\tools便于cmd命令调试。原创 2014-03-12 19:35:34 · 1211 阅读 · 0 评论 -
What is CCS?
CCS是Code Composer Studio的简称,是TI公司提供的DSP集成开发环境。现在最新的版本是5.4,不过最常用的还是3.3版本,教程也是最多的。要学DSP首先要学CCS的使用。原创 2013-04-18 19:29:58 · 913 阅读 · 0 评论 -
英文投稿的一点经验
英文投稿的一点经验【转载】 1. 首先一定要注意杂志的发表范围, 超出范围的千万别投,要不就是浪费时间;另外,每个杂志都有他们的具体格式要求,一定要按照他们的要求把论文写好,免得浪费时间,前些时候,我的一个同事向一个著名的英文杂志投稿,由于格式问题,人家过两个星期就退回来了,而且说了很多难听的话,说投稿前首先就应该看清楚他们的格式要求;2. 论文写作一定要言简意赅,特别是摘要,引言和结论部转载 2013-04-07 19:12:12 · 5163 阅读 · 0 评论 -
涉足计算机视觉领域要知道的
涉足计算机视觉领域要知道的做机器视觉和图像处理方面的研究工作,最重要的两个问题:其一是要把握住国际上最前沿的内容;其二是所作工作要具备很高的实用背景。解决第一个问题的办法就是找出这个方向公认最高成就的几个超级专家(看看他们都在作什么)和最权威的出版物(阅读上面最新的文献),解决第二个问题的办法是你最好能够找到一个实际应用的项目,边做边写文章。 做好这几点的途径之一就是利用网转载 2013-04-07 18:26:07 · 1058 阅读 · 0 评论 -
BMP图四字节对齐的问题
1、内存分配单位是32位的,即4字节; 2、位图中每行象素的数据是连续的,而下一行不能和上一行共一个分配单元(4字节),所以每行象素的数据长度必须是4字节的倍数; 3、代码说明如下: int WidthBytes( int nBits, int nWidth ) {//nBits为色彩位数, nWidth转载 2012-11-06 20:53:56 · 3506 阅读 · 4 评论 -
BMP小细节
54个字节的头文件以后,如果是16色或256色BMP,则有个颜色表,但24位色BMP没有这个,而是实际的像素数据。24位色BMP中,每三个字节表示一个像素的颜色。需要注意的地方:1、OpenGL通常使用RGB来表示颜色,但BMP文件则采用BGR,就是说,顺序被反过来了。2、BMP文件的像素量不一定完全等于图像的高度乘于宽度,而是可能略大于这个值,因为BMP文件采用了一种对齐格式,令原创 2012-11-08 12:16:37 · 550 阅读 · 0 评论 -
Camshift原理
Camshift原理camshift利用目标的颜色直方图模型将图像转换为颜色概率分布图,初始化一个搜索窗的大小和位置,并根据上一帧得到的结果自适应调整搜索窗口的位置和大小,从而定位出当前图像中目标的中心位置。分为三个部分:1--色彩投影图(反向投影):(1).RGB颜色空间对光照亮度变化较为敏感,为了减少此变化对跟踪效果的影响,首先将图像从RGB空间转换到HSV空间。(2).然原创 2013-03-14 09:43:38 · 1507 阅读 · 0 评论 -
彩色转灰度算法 RGB to Grey
一、基础 而对于彩色转灰度,有一个著名的心理学公式: Gray = R*0.299 + G*0.587 + B*0.114 二、整数算法 而实际应用时,希望避免低速的浮点运算,所以需要整数算法。 注意到系数都是3位精度的没有,我们可以将它们缩放1000倍来实现整数运算算法:Gray = (R*299 + G*587 + B*1转载 2012-11-08 09:32:28 · 1102 阅读 · 0 评论 -
聚类算法
聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。 俗话说:“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。所谓类,通俗地说,就是指相似元素的集合。聚类分析又称群分析,它是研究(样品或指原创 2013-03-29 16:22:27 · 2404 阅读 · 0 评论 -
欧几里得距离 曼哈坦距离 明考斯基距离
欧几里得距离:d(i,j) = (|xi1-xj1|2+|xi2-xj2|2+……+|xip-xjp|2)1/2这里i=(xi1,xi2,……,xip)和j=(xj1,xj2,……,xjp)是两个p维的数据对象。 曼哈坦距离d(i,j)=|xi1-xj1|+|xi2-xj2|+……|xip-xjp| 上面的两个公式必须满足下面的条件:d(i,j)≧0:距离非负。原创 2013-04-01 09:32:34 · 6675 阅读 · 0 评论 -
聚类算法的分类
原创 2013-04-01 09:45:37 · 977 阅读 · 0 评论 -
核密度估计简介
核密度估计又叫核函数估计。kernel density estimation是在概率论中用来估计未知的密度函数,属于非参数检验方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基于数据集密度函数聚类算法提出修订的核密度估计方法。由给定样本点集合求解随机变量的分布密度函数问原创 2013-04-03 16:36:40 · 3477 阅读 · 0 评论 -
归一化
归一化是一种简化计算的方式,即将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量。 在多种计算中都经常用到这种方法。归一化方法有两种形式,一种是把数变为(0,1)之间的小数,一种是把有量纲表达式变为无量纲表达式。 归一化函数举例:1、线性函数转换,表达式如下y=(x-MinValue)/(MaxValue-MinValue)说明:x、y分别为转换前、后原创 2013-04-03 16:06:26 · 1275 阅读 · 0 评论 -
维数灾难 curse of dimensionality
维数灾难一般有两种说法:一种是维数很高的情况下,计算机的内存以及运算时间会超长;另一种,维数很高,样本量很小的情况下进行参数估计不能获得正确的估计。机器学习中是指第二种。原创 2013-04-04 11:19:51 · 1731 阅读 · 0 评论 -
Parzen窗估计
最近看mean shift原理,里面提到了Parzen窗估计。网上找了点资料。Parzen窗估计属于非参数估计。所谓非参数估计是指,已知样本所属的类别,但未知总体概率密度函数的形式,要求我们直接推断概率密度函数本身。非参数估计的方法主要有:直方图法、核方法。Parzen窗估计属于核方法的一种。核函数要满足概率密度函数的条件:概率密度P(x)的基本公式:P(x) = (k原创 2013-04-03 20:09:54 · 29401 阅读 · 3 评论 -
关于TI CCS版本的一些个人观点
Code Composer Studio 包含一整套用于开发和调试嵌入式应用的工具。它包含适用于每个 TI 器件系列的编译器、源码编辑器、项目构建环境、调试器、描述器、仿真器以及多种其它功能。CCS IDE 提供了单个用户界面,可帮助您完成应用开发流程的每个步骤。借助于精密的高效工具,用户能够利用熟悉的工具和界面快速上手并将功能添加至他们的应用。刚开始接触TI CCS的时候,用的是CCS2转载 2013-04-11 16:47:56 · 20929 阅读 · 0 评论