下面文稿是我数字图像处理汇报时的PPT中的,虽然下面没什么人听,但是我还是想分享出来。
一、为什么要进行频域变换?
想象你正在聆听一场交响乐,乐曲中融合了低沉的鼓声、悠扬的小提琴声和尖锐的镲片声。如果这些声音直接混合在一起,你可能很难单独调节某种乐器的音量,或者分辨出哪种乐器更加突出。然而,如果使用“调音台”将不同频段的声音(低频、中频和高频)进行分离,你就可以独立增强鼓声的力度,或者降低镲片声的刺耳感。
图像也是一样。
图像中的低频部分:类似鼓声,代表平滑的背景和整体形状。
图像中的高频部分:类似镲片声,代表细节、边缘和噪声。 如果我们想把图像的“背景调暗”或者“锐化边缘”,直接在原始图像上操作就像直接调整所有乐器音量一样困难,但通过频域变换,我们可以针对不同频率成分进行精确处理。
人脸图像中,肤色相对一致的区域(如脸颊或额头)在图像中表现为灰度变化缓慢的区域,对应的频率值很低,属于低频;而人脸的边缘区域(如眼睛、鼻子和嘴唇的轮廓)则表现为灰度变化剧烈的区域,对应的频率值较高,属于高频。这种频率特征有助于我们在图像处理中识别和突出人脸的具体特征。
所以说,图像的频率是表征图像中灰度变化剧烈程度的指标!
% 创建低频和高频掩模
low_pass_mask = zeros(rows, cols);
high_pass_mask = zeros(rows, cols);
% 定义低频和高频的范围
low_freq_radius = 10; % 低频范围
% 生成低频掩模
[x, y] = meshgrid(1:cols, 1:rows);
low_pass_mask((x - ccol).^2 + (y - crow).^2 <= low_freq_radius^2) = 1;
% 生成高频掩模
high_pass_mask = 1 - low_pass_mask; % 高频掩模为低频掩模的补集
% 应用掩模
low_freq = dftshift .* low_pass_mask; % 低频部分
high_freq = dftshift .* high_pass_mask; % 高频部分
二、频域变换的常见步骤
(1)傅里叶变换将图像从空间域转换到频率域,以观察其频率分布。默认情况下,低频成分集中在图像四个角落,而高频成分位于中心,这种布局在视觉上不够直观。
(2)为了更直观地观察和分析图像的频率分布,我们通常会使用“零频移位”(zero-frequency shift)操作,将低频成分移到图像的中心。
(3)假设傅里叶变换的幅度值为 A,对数幅值的计算公式为:log(1+∣A∣) 。这种压缩效果使得幅度值的分布更加均匀,从而使得图像看起来更加顺滑。
前三步对应的流程图如下所示:
img = double(img);
% 傅里叶变换
dft = fft2(img); % 计算傅里叶变换
dftshift = fftshift(dft); % 将低频分量移到中心
% 计算幅值的对数
magnitude = log(1 + abs(dftshift));
频域变换的可逆性是指在执行频域变换后,能够通过逆变换完整地恢复原始图像的特性。如果没有信息损失(例如在压缩或滤波过程中没有删除关键信息),逆变换能够准确地恢复出原始图像。这确保了在图像处理的各个阶段,数据的完整性。
“原始图像 -> 频域变换 -> 频域分析和处理 -> 逆变换”是图像频域变换的一个常见思路。
(1)从传感器、文件或其他数据源获取原始信号或图像。
(2)使用傅里叶变换、小波变换等频域变换方法,将图片从时间域或空间域转换到频域。
(3)在频域中,可以对不同的频率分量进行操作。这包括滤波(如低通、高通、带通滤波)、增强、压缩等。根据具体需求,可以选择保留或抑制某些频率成分,以实现信号或图像的优化。
(4)保证在没有信息损失的情况下,能够重构出原始图像。
% 傅里叶变换
dft = fft2(img); % 计算傅里叶变换
dftshift = fftshift(dft); % 将低频分量移到中心
% 计算幅值的对数
magnitude = log(1 + abs(dftshift));
% 傅里叶逆变换
ishift = ifftshift(dftshift); % 将低频分量移回原位置
iimg = ifft2(ishift); % 执行逆变换
res2 = abs(iimg); % 计算逆变换幅值
再直观观察:
低频成分: 频谱图的中心区域通常包含低频成分,低频成分主要表示图像的整体结构、形状和亮度变化。它们对应于图像中较平滑的区域或缓慢变化的区域。 在二维频谱图中,低频成分的能量一般较高,特别是在平坦或渐变的区域。
高频成分: 频谱图的边缘区域通常包含高频成分,这些成分对应于图像的细节、边缘和噪声。高频成分代表了快速变化的图像部分,如边缘、纹理等。 高频成分的能量相对较低,且在噪声图像中可能更为显著。