数字图像相关知识解析
1. 数字图像基础
在机器视觉领域,数字图像的处理和理解是核心内容。精确重建图像需要采样率至少是信号最高频率的两倍,但在实际应用中,我们通常更关注提取完成当前任务所需的信息,而非精确重建图像的最细微细节。
当连续值的模拟信号被划分为离散范围时,就会产生量化误差,这种误差常表现为轮廓效应。例如,用16级灰度(4位)表示的人脸图像和用8级灰度(3位)表示的人脸图像,后者可能会因量化误差出现更明显的轮廓。
2. 深度图像的获取方式
深度图像的获取主要有两种方式:立体视觉和结构光照明。
2.1 立体视觉
大多数动物有两只眼睛,通过两个视角可以提取三维信息,这在几何上是可行的。如果知道两个相机之间的距离、每个相机的观察角度(在大多数立体视觉系统中,相机的中线是平行的),并且能够测量场景中特定点在两个图像中的位置,就可以计算出物体的距离,即“深度”。但要实现这一点,需要解决对应问题,即确定左图像中的哪个点对应右图像中的哪个点。
为了简化对应问题,常假设两个相机完全平行,这样左图像中某条线上的点会出现在右图像的同一条“极线”上。极线连接了一个点及其对应点,这一假设能显著降低对应问题的复杂度。
解决对应问题的方法有很多,大多数集中在点匹配上。例如,Bokil和Khotanzad通过建立灰度兼容性矩阵(GLCM)来实现点匹配。他们先计算左图像第i行和右图像第j列亮度值之差的绝对值,确定矩阵的i, j元素,然后对GLCM值进行归一化,建立行与行之间的相关性并选择最佳匹配。
此外,分层匹配可以使对应问题更易于解决,即两个低级特征(如极线边缘)只有在它们所
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



