总结A Content-Aware Image Prior

一、论文总体结构

二、图像特点

我们使用广义高斯分布来拟合图像梯度

{\rm{p}}(\nabla x){\rm{ = }}\frac{​{\gamma {\lambda ^{\frac{1}{\gamma }}}}}{​{2\Gamma (\frac{1}{\gamma })}}\exp ( - \lambda {\left\| {\nabla x} \right\|^\gamma })

(1)

$\Gamma $是Gamma function,$\gamma , \lambda $是shape参数,$\gamma $$\lambda $分别决定图像的峰值和宽度

我们假设${\nabla _{\rm{o}}}x{\nabla _{\rm{a}}}x$相互独立,即:$p({\nabla _o}x,{\nabla _a}x) = p({\nabla _o}x)p({\nabla _a}x)$

2.1 空间变化的梯度统计

空间变化梯度分布的两个原因:图像里面的材料以及拍摄距离

例如:

  1. 建筑与碎石路相比,建筑会更加平滑
  2. 即使是同样的碎石路,如果拍摄距离不一样,那么也会具有不一样的梯度统计特征

2.2在自然图像里面的$\gamma ,\lambda $分布

不同的纹理有不同的$\gamma ,\lambda $,为了研究这一特性,本文做了一个实验,那就是从500幅高质量的图像之中采样了110000幅图像块,每一个图像块的大小为,我们求解$\gamma $$ \lambda $的值来拟合每一个图像块的梯度分布,具体$\gamma $$ \lambda $求解可以使用KL散度来求(KL散度可以度量两个分布之间的差异)

[\tilde \gamma ,\tilde \lambda ] = \arg \mathop {\min }\limits_{\gamma ,\lambda } {\rm{\{ - }}\frac{1}{​{\rm{N}}}\sum\limits_{i = 1}^N {\ln (p(\nabla {x_i}))} {\rm{\} }}

(2)

上式就是KL散度的简化版

三、自适应图像先验

3.1 图像还原建模

{\rm{y}} = k \otimes x + n

(3)

K:模糊核  n:噪音  y:模糊图像  x:清晰图像

条件随机场的恢复模型如下:

p(x|y,k,\eta ) \propto \frac{1}{M}\mathop \prod \limits_i^{} {\Phi _y}(x;{y_i},k,\eta ){\Phi _x}(x)

(4)

其中

{\Phi _y}(x;{y_i},k,\eta )\; \propto \;\exp ( - \frac{​{​{​{({y_i} - {​{(k \otimes x)}_i})}^2}}}{​{2{\eta ^2}}})

(5)

{\Phi _{\rm{x}}}(x)\; \propto \;\exp ( - \lambda {\left\| {\nabla x} \right\|^\gamma })

(6)

上式(4)跟MAP很像。

为了给随着空间而变化的梯度建模,我们引入了一个额外的隐藏变量z,这个变量被称为纹理,z是用来控制图像先验的shape参数的:

{\rm{p}}(x,z|y,k,\eta ) = \frac{1}{M}\mathop \prod \limits_i^{} {\Phi _y}(x;{y_i},k,\eta ){\Phi _{x,z}}(x,z)

(7)

其中

{\Phi _{x,z}}(x,z) \propto \exp ( - \lambda (z){\left\| {\nabla x} \right\|^{\gamma (z)}})

(8)

由上式可知,$\gamma ,\lambda $已经变成了一个随着纹理变化而变化的值,这样就达到不同的纹理使用不同的梯度先验(以前是使用一组$\gamma ,\lambda $来对整幅图像进行恢复)。我们把z设置为一个连续变量,因为$[\gamma ,\lambda ]$是拖尾分布并且不会形成紧密的群。

我们最大化公式(4)可以估计出清晰的图像,同时,我们令:

{\rm{p}}(x|y,k,\eta ) = \int_{\rm{z}}^{} {p(x,z|y,k,\eta )dz} \approx p(x,\tilde z|y,k,\eta )

(9)

这里我们为每一个像素都估计一个值。式(9)里面的等式可以看成是边缘概率分布,边缘概率分布函数的公式如下:

{​{\rm{f}}_x}(x) = \int_{ - \infty }^{ + \infty } {f(x,y)dy{​{\rm{f}}_y}(y) = \int_{ - \infty }^{ + \infty } {f(x,y)dx} }

(10)

3.2 估计纹理参数{\rm{\tilde z}}

零均值广义高斯分布(也就是我们用来拟合图像先验的分布函数)的一个显著的特点是:方差v和四阶矩f完全决定了shape参数$[\gamma ,\lambda ]$:

v = \frac{​{\Gamma (3/\gamma )}}{​{​{\lambda ^{\frac{2}{\gamma }}}\Gamma (1/\gamma )}},f = \frac{​{\Gamma (5/\gamma )}}{​{​{\lambda ^{\frac{4}{\gamma }}}\Gamma (1/\gamma )}}

(11)

为了利用这个关系,我们定义了将一个像素i周围的局部纹理{\rm{\tilde z}}定义为一个二维向量:

{​{\rm{\tilde z}}_i} = [{v_i}(\nabla x),{f_i}(\nabla x)]

(12)

其中,梯度{v_i}(\nabla x)编码了分布的宽度,四阶矩{f_i}(\nabla x)编码了分布的峰值,注意,我们很容易就能计算得到${v_i},{f_i}$,具体的方法是用一个窗口函数来与梯度图像卷积,我们使用的高斯窗口的标准差为4个像素。

一般来说我们应该使用清晰图像来估计,但是因为我们只有模糊图像,那么我可以先手动选择一组参数,然后估计得到一个较为合理的清晰图像,进而估计{\rm{\tilde z}},我们选择的参数为$[{\gamma _o} = 0.8,{\lambda _o} = 6.5],[{\gamma _a} = 0.6,{\lambda _a} = 6.5]$。因为使用固定的参数来重建图像很可能会破坏图像的梯度进而导致估计错误,为了减少这种纹理估计误差,我们对所有维度进行下采样这个反卷积图像(就是上一步使用固定先验进行反卷积之后的图像)2倍(下采样后梯度分布并不会改变,但是反卷积噪音会变少),执行这一步之后估计得到的通常能够更加接近真实的。

3.3 从{\rm{\tilde z}}来估计shape参数$\gamma ,\lambda $

可以直接使用公式(11)来计算$[\gamma ,\lambda ]$,但是求逆的计算量非常大,而且对噪声非常敏感,因此我们可以使用模糊核回归器来将纹理对数$\ln (\tilde z)$映射成为$[\gamma ,\ln (\lambda )]$

为了学习回归函数,我们从500幅高质量图像中采样了125000幅的图像块,我们用广义高斯分布函数来拟合每一个图像块。

我们使用收集到的数据和LibSVM算法来学习这个$[\ln (v),\ln (f)][\gamma ,\ln (\lambda )]$映射并且使用交叉验证的方式来避免过拟合。

3.4 处理纹理边界

为了估计纹理边界处的shape参数,我们使用高斯条件随机场(GCRF)来对估计的shape参数进行正则化,我们想要平滑纹理边界处的shape参数,我们利用了一个特点:用两个不同大小的窗口来估计\tilde z会得到不同的值,小窗口横跨同样的纹理,大的窗口横跨两种不同的纹理,因此会产生不同的\tilde z。我们利用这个特点来平滑纹理边界处的shape参数,通过在GCRF中将观察噪音水平定义为不同窗口大小得到的方差v和四阶矩f的均值(这两个不同窗口的大小的像素分别为2个像素和4个像素)。

3.5 实现细节

最终我们最小化下面的式子来估计清晰图像:

{\rm{\hat x = }}\arg \mathop {\min }\limits_x \left\{ {\frac{​{​{​{(y - k \otimes x)}^2}}}{​{2{\eta ^2}}} + w\sum\limits_{i = 1}^N {({\lambda _o}({​{\tilde z}_i}){​{\left\| {​{\nabla _o}x(i)} \right\|}^{​{\gamma _o}({​{\tilde z}_i})}} + {\lambda _a}({​{\tilde z}_i}){​{\left\| {​{\nabla _a}x(i)} \right\|}^{​{\gamma _a}({​{\tilde z}_i})}})} } \right\}

(13)

W是权重,在所有样例中,我们设置w=0.025

世界地图矢量数据可以通过多种网站进行下载。以下是一些提供免费下载世界地图矢量数据的网站: 1. Open Street Map (https://www.openstreetmap.org/): 这个网站可以根据输入的经纬度或手动选定范围来导出目标区域的矢量图。导出的数据格式为osm格式,但只支持矩形范围的地图下载。 2. Geofabrik (http://download.geofabrik.de/): Geofabrik提供按洲际和国家快速下载全国范围的地图数据数据格式支持shape文件格式,包含多个独立图层,如道路、建筑、水域、交通、土地利用分类、自然景观等。数据每天更新一次。 3. bbbike (https://download.bbbike.org/osm/): bbbike提供全球主要的200多个城市的地图数据下载,也可以按照bbox进行下载。该网站还提供全球数据数据格式种类齐全,包括geojson、shp等。 4. GADM (https://gadm.org/index.html): GADM提供按国家或全球下载地图数据的服务。该网站提供多种格式的数据下载。 5. L7 AntV (https://l7.antv.antgroup.com/custom/tools/worldmap): L7 AntV是一个提供标准世界地图矢量数据免费下载的网站。支持多种数据格式下载,包括GeoJSON、KML、JSON、TopJSON、CSV和高清SVG格式等。可以下载中国省、市、县的矢量边界和世界各个国家的矢量边界数据。 以上这些网站都提供了世界地图矢量数据免费下载服务,你可以根据自己的需求选择合适的网站进行下载
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值