第十七周学习笔记
阅读《计算机视觉——算法与应用》
3.3 更多的邻域算子
3.3.1 非线性滤波
线性滤波器易于构造,且易于从频率响应的角度来进行分析(3.4节)
但在很多情况下,非线性组合也可以有很好的结果,比如噪声是散粒噪声而非高斯噪声(# TODO 验证)
中值滤波
中值滤波选择每个像素邻域像素的中值作为输出,可以处理散粒噪声
缺点
- 中等计算代价
- 不能有效去除规则的高斯噪声,此时采用α\alphaα截尾均值滤波可以得到更好的效果
双边滤波器
抑制与中心像素的值差别太大的像素,相比常用的可分离滤波器慢
迭代自适应平滑和各向异性扩散
可以采用迭代的方式使用滤波器,为了得到更“卡通”的表现
3.3.2 形态学
二值图像中的形态学算子,可以改变二值图像中物体的形状,标准的二值形态学算子包括:
- 膨胀,使物体扩张(变厚)
- 腐蚀,使物体收缩(变细)
- 过半,使锐利的角落变平滑
- 开运算,保留大部分区域,去掉小的物体或洞,使边界平滑
- 闭运算,保留大部分区域,去掉小的物体或洞,使边界平滑
3.3.3 距离变换
距离变换通过两遍扫描的光栅算法,可以快速预计算到曲线或点集的距离
3.3.4 连通量
连通量定义为具有相同输入值(标签)的邻接像素的区域
3.4 傅里叶变换
为了分析一个给定的滤波器对于高频、中频、低频的作用,可以使用一个已知频率的正弦波通过滤波器,观察正弦波变弱程度xcbo
3.4.1 傅里叶变换对
书中P105给出了一些常用的傅里叶变换对
3.4.2 二维傅里叶变换
一维傅里叶变换的公式可以直接扩展到二维上
3.4.3 维纳滤波
假定图像来源于一个相关的高斯噪声随机场,并与一个测量过程的统计模型相结合,则可以构造出一个最优的复原滤波器,次滤波器称为“维纳滤波”
离散余弦变换
傅里叶变换的一个变种,被广泛应用于目前图像和视频的压缩算法中
3.4.4 应用:锐化,模糊和去噪
图像处理中的一个普遍应用是通过使用锐化和去噪声的算子增强图像,此时需要特定的邻域处理,即使用上述的各种线性和非线性算子
度量图像算法的去噪效果,一般会给出类似PSNR(峰值信噪比)的测量结果,这主要针对人为合成的情况,更好的度量方法是基于感知相似性度量的策略,如结构相似性索引
3.5 金字塔与小波
3.5.1 插值
插值,也称上采样,可以将图片转换到较高的分辨率
3.5.2 降采样
降采样可以降低图像分辨率
3.5.3 多分辨率表达
图像金字塔:图像由粗到精
3.5.4 小波
小波是在空间域和频域都定位一个信号的滤波器
小波与图像金字塔的差异
图像金字塔和小波都将一幅图像分解为空间和频率内的多分辨率描述
传统金字塔过于完备,它们闭原图使用更多像素来描述图像xddgxddg分解
小波提供了一个紧致框架,保持分解图像与原图像大小相等
3.5.5 应用:图像融合
拉普拉斯金字塔可以应用于图像融合
3.6 几何变换
3.6.1 参数化变换
参数化变换对一幅图像进行全局变形,其中变换的行为由少量参数控制
- 前向卷绕
- 反向卷绕
为了防止混叠,我们需要用一个滤波器来预滤波图像f(x)f(x)f(x),该滤波器的频率响应恰好为最后想要的频谱通过A−⊤A^{-\top}A−⊤变换后的投影,但这个滤波器的计算速度很慢,因此常常采用它的一些近似
- MIP-映射
- 椭圆加权高斯平均
- 各向异性滤波
- 多通变换
3.6.2 基于网格的卷绕
更加自由的局部变形
3.6.3 应用:基于特征的变形
建立好的对应关系,可以将两幅图像相同的特征对其,从而进行混合
3.7 全局优化
3.7.1 正则化
正则化理论首先由统计学家提出,试图用模型来拟合严重欠约束解空间的数据
3.7.2 马尔科夫随机场
3.7.3 应用图像的恢复
噪声和图像的锐度的问题更进一步是划痕和斑点,这些问题可以通过贝叶斯方法(MRF)来进行修复
本周考试的原因所以内容较少