计算机视觉图像预处理与特征提取技术解析
1. 图像预处理概述
在计算机视觉中,图像像素数据通常需要进行预处理以形成测量向量。预处理是指在建立将数据与现实世界关联的模型之前,对像素数据进行的任何变换。这些变换往往是基于经验的临时启发式方法,其参数并非从训练数据中学习得到,而是根据实际效果的经验来选择。
图像预处理的目的在于去除图像中与当前任务无关的多余变化,同时保留对最终决策至关重要的图像特征。例如,在目标检测任务中,图像的 RGB 值会受到相机增益、光照、物体姿态和物体实例等多种因素的影响。预处理的目标就是尽可能减少这些不必要的变化。
不过,预处理也存在一定的局限性。它意味着我们无法直接对 RGB 值与世界状态之间的关系进行建模,并且在去除多余变化的同时,很可能会丢弃一些与任务相关的信息。但在计算机视觉发展的现阶段,这通常并非影响整体性能的关键因素。
2. 逐像素变换方法
逐像素操作是预处理的一种重要方式,它会为输入图像的每个像素返回一个单一值。我们将原始的二维像素数据数组记为 P,其中 $p_{ij}$ 表示第 i 行第 j 列的元素,代表灰度强度。逐像素操作会返回一个与 P 大小相同的新二维数组 X,其中元素为 $x_{ij}$。
2.1 白化(Whitening)
白化的目标是使图像在平均强度水平和对比度的波动方面具有不变性。这种波动可能源于环境光照强度的变化、物体反射率或相机增益的改变。为了补偿这些因素,图像会被转换为使得像素值具有零均值和单位方差。
具体操作步骤如下:
1. 计算原始灰度图像 P 的均值 $\mu$ 和方差 $\sigma^2$:
- $
超级会员免费看
订阅专栏 解锁全文
1487

被折叠的 条评论
为什么被折叠?



