本文是对机器视觉使用过程中常会碰到的相关知识理论,在这里仅做记录,以备后续进行查找。
图形与图像的基础知识
图形是由称为矢量的数学对象所定义的额直线和曲线等组成。
图像是由点阵图或位图图像或像素来代表的图像,每一个像素都被分配一个位置和颜色值。
颜色三要素
色调:色调主要指颜色的类别,比如红色、绿色等。
饱和度:饱和度指某一颜色的深浅程度。对于统一色调的颜色,饱和度越高颜色越深,。
亮度:是描述光作用于人眼时引起的明暗程度感觉,主要是彩色明暗的深浅程度。彩色辐射频率越大亮度越高。
颜色模型
颜色模型是用来精确标定和生成各种颜色的一套规则和定义。常见的颜色模型有:RGB颜色模型、CMY颜色模型、YUV颜色模型。
三基色为红绿蓝。
图像获取
图像获取是指将现实中的图像转换为计算机的图文内容。其过程为:采样,量化,编码
图像的属性
图像的属性主要包括:分辨率、像素深度、真/伪彩色、图像的表示法、种类。
图像分辨率:组成一幅图像的像素数目。
采用图像的水平方向和垂直方向的像素数来表示。
显示分辨率:显示设备能够显示图像的区域大小。一般用于 显示显示设备水平方向和垂直方向的最大像素的数目。比如1024*768
像素深度:存储每个像素所用的二进制位数,用来度量图像的色彩分辨率的。
像素的位数越多,它表达的颜色数组越多,深度就越深
真彩色:组成一幅彩色图像的每个像素值中有R、G、B这个三个基色分量,每个基色分量直接决定显示设备的基色强度。
反映原图像真实色彩称为真彩色。
伪彩色:图像中的每个像素的颜色不是由3个基色分量的数值直接表达的,而是把像素值作为地址索引在色彩表中查找这个像素的实际R、G、B分量,这种图像颜色的表达方式称为伪彩色
图像数据量计算
数据量的计算公式为:图像的数据量=图像的总像素数*像素深度/8(Byte)。
假设有一幅图,其为640*480的256色图像,数据量为:
640*480*8/8=300KB 。
数据量越大占用的存储空间就越大,减少图像的数据量是提供图像网络传输速度的重要手段
数据压缩可以用来减少图像的数据量,这里不再赘述其方法。
图像的文件格式
BMP文件(.bmp)
windows操作系统采用的一种图像文件格式。一般不采用其他任何压缩,占用存储空间比较大。图像深度可选1位、4位、8位、24位。黑白、16色、256色和真彩色。
GIF文件(.gif)
可以实现简单动画效果的图像文件格式。图像深度为1~8位,最多支持256中色彩图像。常用于HTML文档当中。
TIFF文件(.tif)
针对扫描仪和桌面系统开发的通用图像文件格式。
PCX文件(.pcx)
PC画笔的图文件格式。
PNG文件格式(.png)
PNG文件支持无损 数据压缩。为了替代gif。
JPEG文件(.jpg)
采用JPEG压缩算法、文件的压缩比例很高,非常适合处理大量图像的场合。
WMF文件(.wmf)
只用在windows系统中保存的不是点阵信息,而是函数调用的信息
会用到的几个图像基本名词
像素
组成图像的最基本元素。再具体一点,我们可以把像素看成是具有各自图像属性(比如颜色,亮度等)的小方块,当他们按照一定的顺序进行排列时,就形成了我们所看到的图像
灰度图
像素在计算机中的描述。灰度图是单通道图,像素只有一个值:灰度值。灰度值越高,则图像越亮。
一张灰度图是由许多不同灰度值的像素点构成,而每个像素就是一个越亮的像素,灰度值越高,最高值是255(白色),越暗的像素,灰度值越低,最低值是0(黑色)。灰度值在0~255之间的像素呈现不同程度的灰色。
排列这些灰度值形成一个灰度图,其就是通过矩阵的形式来进行排列的。根据分辨率为多少进行排列_mat[*,*](*行*列)。
灰度直方图
表示灰度在这张图中的分布情况。能够直观看出各个灰度级所占的多少。
图像的灰度直方图是灰度级的函数,描述的是图像中具有该灰度级的像素的个数:其中,横坐标是灰度级,纵坐标是该灰度级出现的频率。
色彩空间
RGB空间:
RGB模型是面向硬件的,一张RGB图像,它是一张三通道的图像。分别为R通道,G通道,B通道。我们通常用通道这个词汇来表示向量中的某个分量。
HSV空间:
H为色调(hue),S是饱和度(saturation),V是明度(value)