在当今的计算机视觉领域,图像表示是一项至关重要的任务。它不仅能够帮助我们更高效地处理和分析图像,还在图像生成、分类等多个方面发挥着关键作用。
图像的本质与表示需求
图像本质上是矩阵,彩色图像包含红、绿、蓝(RGB)三个颜色通道,由三个矩阵拼接而成;而灰度图像只有一个通道,用一个矩阵表示。图像表示就是将图像矩阵(灰度或 RGB)从其正常维度转换为更低维度,同时保留图像最重要的特征。
为什么要在低维度分析图像呢?主要原因是节省计算资源。当我们只处理单个图像时,计算量的问题可能不明显,但在计算机视觉的机器学习中,通常需要分析成千上万的图像,此时高效计算就变得至关重要。例如,在某些算法中,处理左侧图像时可能需要分析 27 个特征,而处理中间图像时,根据图像维度的不同,可能要分析数千个特征。
此外,并非图像的每个方面对于其特征描述都很重要。比如有两张图像,一张全黑,另一张是中间有个白点的黑色图像,要找出这两张图像的差异,左上角的黑色像素对结果的影响并不大。
图像分析的内容与传统方法
当我们观察一组图像时,很容易发现它们的相似性和差异性,这些差异可能是结构上的(如光强度、模糊、噪声),也可能是