论文翻译《Fields of Experts: A Framework for Learning Image Priors》

本文提出了一种新的图像先验模型—专家场(FoE),该模型通过学习丰富的滤波器组来捕获自然图像的统计特征。FoE模型在一般的图像数据库上训练,并在图像去噪和修复任务中展现出卓越性能。

专家场:一个学习图像先验的框架

摘要

我们开发了一种可以用于学习一般的具有表现力的图像先验的框架,它捕获了自然场景的统计数据并可以用于多种机器视觉任务。这种方法通过在扩充的像素邻域上学习潜在的功能来推广传统的MRF模型。场势被PoE”专家乘积“框架利用许多线性滤波器响应的非线性函数来建模。对比于之前的MRF,这种模型的所有参数,包括线性滤波器本身,都是通过训练数据习得。我们使用两个典型应用——图像去噪、图像修复,来展示专家场模型的性能,这两个例子使用一个简单的近似的推理方案实现。虽然这个模型是在一般图像数据库上进行训练的而且没有对特殊应用进行调整,但是我们获得了匹敌与甚至超过了专业技术的结果。

1.介绍

很多机器视觉问题包括立体、光流、去噪、超分辨率和基于图像的渲染等等,都出现了对图像结构的先验模型的需求。无论什么时候出现了噪声或者不确定性,图像的先验模型开始起作用。这里我们开发了一个方法,通过利用稀疏图像编码的想法来学习丰富的MRF图像先验。由此产生的专家场依据具有重叠团的随机场对一张图像的先验概率进行建模,它的势被表示为专家产品。

我们展示了这个模型如何在一个自然图像的标准数据库上被训练,并开发了一个扩散式的、利用近似贝叶斯推论的先验的方案。为了证明FoE模型的建模能力,我们在两种不同的应用中使用它:图像去噪和图像修复。尽管先验具有一般性质并且近似推论简单,但是我们直到现在获得的最新结果是不可能用MRF方法得到的。图片1阐明了FoE模型在图像去噪和图像修复的应用。在下面我们提供了一个详细的关于这些方面的最新技术的性能的定量分析。

图形先验建模具有挑战性,由于图像的高维度、非高斯统计和对扩展领域上图像结构的相关性建模的需求。经常发现,对于各种线性滤波器,边缘滤波器相应是非高斯的,不同滤波器的响应经常不是独立的。

稀疏编码方法尝试解决一些在复杂图像结构建模方面的问题。尤其是,他们按照一组线性滤波器响应来对图像的结构属性建模。从各种简单的假设开始,许多作者已经获得了局部图像结构的稀疏表示,按照在位置、方向和规模的局部滤波器的统计数据。然而,这些方法集中于图像碎片,没有提供直接的方法对统计的整个图像进行建模。

马尔可夫随机场在另一方面已经被广泛使用在机器视觉领域,但是展示出严重的局限性。特别是,MRF先验典型地利用了手工团势和小邻域系统,这限制了模型的可表达性而且粗糙地捕获自然图像的统计数据。典型的模型考虑简单的最近的邻域关系和模型一阶微分滤波器的响应。通过系数编码方法获得的丰富的基于碎片的先验与被大多数MRF方法极度采用的局部先验(利于一阶)具有鲜明的对比。

朱松纯和芒福德向更加实用的MRF迈进了一步,介绍了允许MRF先验可以通过训练数据被学习获得的FRAME模型。然而这种方法仍然依赖于手动选择的图像过滤器集合,从中建立图像先验。这种方法由于使用了离散过滤器直方图而变得复杂,而且报道的图像重建结果低于最先进水平。另一项工作是使用多种、非局部的成对像素交互来实现对复杂空间属性的建模。到目前为止,这些方法仅仅用于纹理合成而不是对一般图像先验建模。

为了对复杂的局部统计数据进行建模,很多作者转向了由图像碎片数据库捕获的经验概率模型。弗里曼在[7]中提出一个MRF模型,这个模型使用了示例图像碎片和他们之间的一致性的度量来建立场景结构。这个想法最近被用作基于图像的渲染的先验模型,并与基于实例的纹理合成有关。其他的MRF模型使用帕森窗口方法来定义场的势。Jojic在[14]中使用了一张图片或一组图片的一个微型版本,叫做缩影,来描述一张图片。尽管也许有可能使用这种方法当作一般图像先验,但是这种可能性尚未被开发。

本文的目标是开发一个学习自然图像的丰富的、一般的先验模型的框架。相比于基于实例的方法,我们开发了一个使用例子进行训练的参数表示,但是不依赖实例作为表示的一部分。这种参数化模型比基于实例的模型更有优势,因为它可以更好的概括训练数据之外的内容并允许更优雅的计算技术。关键思想是通过使用学习滤波器对局部场势进行建模,推广马尔可夫随机场超越FRAME。为了做到这样,我们利用PoE框架[11]的思想。早先的使用PoE对图像建模的成就是基于碎片的,因此不适用于学习任意尺寸的图像的一般先验。我们推广这种方法,产生平移不变的先验。专家场框架提供了原则性的方式从例子中学习MRFs,并且极大提高的建模能力使他们适用于复杂任务。

2.稀疏编码和专家产品

小图像碎片的统计在文献中被广泛处理。特别是,稀疏编码方法[18]用学习过滤器或“基”的线性组合来表示一个图像碎片。

 

是向量化的图像碎片,是一个惩罚非零系数的稀疏先验。这个方程的变化导致了主要成分、独立成分和更特殊化的滤波器。

独立成分分析(ICA)可用于定义图像碎片的一个概率模型。由于被ICA发现的成分是假设独立的,所以我们可以简单地将他们的边缘分布相乘来得到一个先验模型。然而,对于n个像素的图像碎片,一般不可能找到n个完全独立的线性成分,这使得ICA模型仅仅是一个近似法。

威林等人使用一个基于专家产品框架的模型打破了这一限制。PoE框架背后的思想是使用几个专家分布的乘积来对高维概率分布建模,其中每一个专家工作在一个相对容易建模的低维子空间。通常,专家被定义在线性的一维子空间(相当于稀疏编码模型中的基向量)。请注意,将图像碎片投射到线性成分(

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值