计算机视觉图像预处理与特征提取技术详解
1 引言
在计算机视觉领域,图像预处理是至关重要的环节。通常,我们会将视觉测量值与现实世界建立联系,但对于测量向量是如何创建的却讨论较少,很多时候默认其包含拼接的 RGB 像素值。然而,在先进的视觉系统中,图像像素数据几乎总是经过预处理后才形成测量向量。
图像预处理是指在构建将数据与现实世界关联的模型之前,对像素数据进行的任何转换。这些转换往往是基于经验的临时启发式方法,其参数并非从训练数据中学习得到,而是根据实际效果选择的。图像预处理的目的是去除图像中与当前任务无关的变化因素,同时保留对最终决策至关重要的图像特征。虽然预处理可能会导致一些与任务相关的信息丢失,但在计算机视觉发展的初期,这通常并非影响整体性能的关键因素。接下来,我们将详细介绍各种图像预处理技术。
2 逐像素变换
逐像素操作是预处理的基础,它会为输入图像的每个像素返回一个对应的值。我们将原始的二维像素数据数组记为 $P$,其中 $p_{ij}$ 表示第 $i$ 行第 $j$ 列的元素,代表灰度强度。逐像素操作会返回一个与 $P$ 大小相同的新二维数组 $X$,其元素为 $x_{ij}$。
2.1 白化
白化的目标是使图像在平均强度水平和对比度波动时保持不变。这种波动可能由环境光照强度、物体反射率或相机增益的变化引起。为了补偿这些因素,需要将图像进行变换,使得到的像素值具有零均值和单位方差。具体步骤如下:
1. 计算原始灰度图像 $P$ 的均值 $\mu$ 和方差 $\sigma^2$:
- 均值 $\mu$ 的计算公式为:$\mu = \frac{\sum_{i=1}^{I}\sum_{j
超级会员免费看
订阅专栏 解锁全文
23万+

被折叠的 条评论
为什么被折叠?



