CVPR2021——图像反射去除基于吸收效应

本文研究了吸收效应在图像反射失真去除中的影响,提出了通过折射振幅系数矩阵均值量化吸收效应的估计方法。文章提出了一种两步解决方案,首先估计吸收效应,然后利用此信息恢复图像。实验结果表明,该方法不仅能有效去除反射失真,还能纠正由于吸收效应引起的亮度失真,展现出优秀的泛化能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要: 本文考虑了吸收效应对于图像反射失真去除的影响,展示了吸收效应可以被折射振幅系数矩阵均值量化的估计。然后重建了图像模型,提出了两步方案。首先估计包含反射失真图像的吸收效应,然后将其作为输入复原图像。实验展示了本文不仅移除了反射失真,且复原了由于吸收效应产生的亮度失真。本文的剪切学习更加展示了方法的优秀表现以及良好的泛化能力。代码开源于https://github.com/q-zh/absorption。

一、简介
  当光照射光滑玻璃表面,就会发生部分的吸收、反射与传播。对于含反射噪声的图像I\bm II,一个广泛使用的模型为I=ΩT+ΦR(1)\bm I = \bm{\Omega T} + \bm{\Phi R} \tag 1I=ΩT+ΦR(1)其中,Ω\bm\OmegaΩΦ\bm\PhiΦ分别代表折射与反射振幅系数矩阵,而T\bm TTR\bm RR代表传播与反射图像。从I\bm II中恢复T\bm TT是一个病态问题,由于T\bm TTR\bm RR的内容不可知性,以及Ω\bm\OmegaΩΦ\bm\PhiΦ的内容无关变量。大多数方法依赖图像内容,如从图像梯度、字典或训练图像得到精准的先验。内容无关变量的性质也被广泛研究并用于多图像反射去除。此外,大多数方案基于理想图像模型,并没有考虑到吸收效应(于第三部分定义),例如玻璃充分薄。最近的工作解决了使用ΦT\bm{\Phi T}ΦT代替T\bm TT,因为吸收效应显著的降低了传播。因为吸收效应独立于图像内容并随玻璃的颜色、厚度、方位,其有助于缓和图像反射去除的病态性。
  本文通过考虑吸收效应,回顾含反射噪声的图像模型。根据仿真结果,可以注意到吸收效应可以通过折射振幅系数矩阵的均值量化的代表,记为avg(Ω)avg(\bm\Omega)avg(Ω)(见5.1节)。作为内容无关变量,avg(Ω)avg(\bm\Omega)avg(Ω)在仿真时具有波动,可以认为准确的估计avg(Ω)avg(\bm\Omega)avg(Ω)有益于解决图像反射去除问题。本文分两步解决问题:首先估计avg(Ω)avg(\bm\Omega)avg(Ω),然后通过两个神经网络复原传播图像T\bm TT。使用二支训练策略,将I\bm IIT\bm TT作为输入以得到avg(Ω)avg(\bm\Omega)avg(Ω)。核心思想在于通过使用神经网络层传播内容无关变量avg(Ω)avg(\bm\Omega)avg(Ω)以减少传播图像与反射图像内容的影响。在第二步中,使用利普希茨【Lipschitz】条件约束,以增加对不同的avg(Ω)avg(\bm\Omega)avg(Ω)值的泛化能力。该方法在公共数据集取得了显著的成效。本文工作总结如下:
  -本文首次提出了吸收效应,用于图像反射去除。此外,吸收效应可以通过反射振幅系数矩阵的均值量化的估计;
  -本文提出两步解决方案:二支训练策略与利普希茨约束条件,用于通过考虑吸收效应解决图像反射去除问题。此外还分析了该方法有益于估计吸收效应并复原传播图像的原因。
  -通过实验展示本文的方法不仅去除反射影响,并借助吸收效应复原亮度失真。本文的方法达到了极好的表现,并拥有较强的模型泛化能力。


二、相关工作


三、吸收效应
  当考虑吸收效应时,双表面光滑玻璃的折射与反射振幅系数矩阵可以描述为Ω=(1−P)2(1−A)(1−P2)(1−A)2Φ=P+P(1−P)2(1−A)21−P2(1−A)2(2)\begin{aligned} \bm\Omega &= \frac{(1-\bm P)^2(1 - \bm A)}{(1 - \bm P^2)(1-\bm A)^2} \\ \bm\Phi &= \bm P + \frac{\bm P(1 - \bm P)^2(1 - \bm A)^2}{1 - \bm P^2(1 - \bm A)^2} \tag 2\end{aligned}ΩΦ=(1P2)(1A)2(1P)2(1A)=P+1P2(1A)2P(1P)2(1A)2(2)其中,A\bm AA定义为吸收效应用于描述当光经过玻璃传播时光的衰减。P\bm PP是空气到玻璃表面的反射率。A\bm AAP\bm PP可以通过朗伯比尔【Lambert-Beer】定律与菲涅尔【Fresnel】公式分别表示为A=1−exp(−kLcosΘt)P=12((cosΘ−KcosΘtcosΘ+KcosΘt)2+(cosΘt−KcosΘcosΘt+KcosΘ)2)(3)\begin{aligned} \bm A & = 1 - exp(\frac{-kL}{cos \bm\Theta_t}) \\ \bm P &= \frac{1}{2}((\frac{cos \bm\Theta - \mathcal Kcos\bm\Theta_t}{cos \bm\Theta + \mathcal Kcos\bm\Theta_t})^2 + (\frac{cos \bm\Theta_t - \mathcal Kcos\bm\Theta}{cos \bm\Theta_t + \mathcal Kcos\bm\Theta})^2) \end{aligned} \tag 3AP=1exp(cosΘtkL)=21((cosΘ+KcosΘtcosΘKcosΘt)2+(cosΘt+KcosΘcosΘtKcosΘ)2)(3)其中,kkk是衰减系数,其代表了玻璃的颜色;LLL是光穿过玻璃经过的距离,其取决于玻璃的厚度;K\mathcal KK是折射率;Θ\bm\ThetaΘ是对于玻璃的入射角;Θt\bm\Theta_tΘt根据斯奈尔【Snell】定律,其值为arcsin(sinΘ/K)arcsin(sin\bm\Theta/\mathcal K)arcsin(sinΘ/K)。对于常见的玻璃,kkk通常取值在4m−14 m^{-1}4m132m−132 m^{-1}32m1之间且K=1.474\mathcal K = 1.474K=1.474。根据第二部分的介绍,一般的图像建模取A=0\bm A = 0A=0Ω+Φ=1\bm\Omega + \bm\Phi = 1Ω+Φ=1,其忽略了吸收效应。对于图像反射去除问题,不依赖于Ω\bm\OmegaΩΦ\bm\PhiΦ的假设会使结果变差,尤其是T\bm TT的整体亮度估计的准确度。相反的,本文考虑一般的图像模型中,A≠0\bm A \ne 0A=0
  从A\bm AA中直接解出I\bm II是一个非平凡任务,因为A\bm AA的矩阵形式以及A\bm AAI\bm II在真实世界的关系。本文假设反射占据整个光滑玻璃,其均匀,各向同性且充满相机的整个视野。基于这种假设,考虑一个标量eee,其是Ω\OmegaΩ的均值,用于在5.1节量化的估计吸收效应。其中,Ω\bm\OmegaΩ可以近似的被分解为eee与矩阵O\bm OO的积,有Ω=eO(4)\bm\Omega = e\bm O \tag 4Ω=eO(4)其中,O\bm OO的所有元素趋近于一。


四、提议方法
  根据第三部分的分析,可以将式(1)的图像建模描述为I=eOT+ΦR(5)\bm I = e\bm{OT} + \bm{\Phi R} \tag 5I=eOT+ΦR(5)作为在现实世界波动的内容无关变量eee(如图3.f所示),本文认为精确的估计eee有助于解决图像反射去除问题,并提出两步解决方案:g:I→e,h1:(I,e)→OT,h2:OT→T(6)\begin{aligned} & g:\bm I \rightarrow e, \\ & h_1: (\bm I, e) \rightarrow \bm{OT}, h_2:\bm{OT} \rightarrow \bm T \end{aligned} \tag 6g:Ie,h1:(I,e)OT,h2:OTT(6)其中,第一步通过网络gggI\bm II中估计eee,而第二步通过网络h1h_1h1eee的辅助下从I\bm II中复原OT\bm{OT}OT,通过网络h2h_2h2OT\bm{OT}OT中复原T\bm TT

4.1 估计吸收效应
  因为CNN通常用于基于图像内容提取特征,使用网络gggI\bm II估计内容无关变量eee并不是一个平凡问题。为此,网络ggg使用成对的OT\bm {OT}OT进行训练,以聚焦于内容无关特征(如图1虚线框部分所示)。其思想是尽管OT\bm{OT}OTI\bm II拥有相似的传播图像内容,但具有不同的eee,例如g(I)g(\bm I)g(I)应该为eee然而g(OT)g(\bm {OT})g(OT)应该为111。因此,内容无关变量eee的特征期望通过有监督方法被学习。尽管该方案有利于隔离传输图像的内容特征,但是其可能使网络ggg聚焦于反射图像的内容(如ΦR\bm{\Phi R}ΦR)。因为I\bm IIOT\bm{OT}OT的差异包括eeeΦR\bm{\Phi R}ΦR。接下来展示缓和反射图像内容的影响并通过设计网络ggg与损失函数LΨL_{\Psi}LΨ聚焦于eee
NetWork  图1,两步解决方案总览。在第一步,网络gggI\bm IIOT\bm{OT}OT作为输入,并分别输出epree_{pre}epreepre′e_{pre}'epre。第二步,网络hhh连接I\bm II与空域重复的epree_{pre}epre,并输出Tpre\bm T_{pre}TpreΨi\bm\Psi_iΨiΨi′\bm\Psi_i'Ψi是网络ggg不同隐藏层的输出。注意到网络ggg的两支在训练时共享权重,虚线框部分在推测时不活动。ZC与BN模块分别执行零均值与批归一化。

  图2展示了真实数据的两组(I,R,ΦR)(\bm I, \bm R, \bm{\Phi R})(I,R,ΦR),可以观察到:强反射占据了稀疏空余的主导地位,这些区域中的I\bm II的亮度远高于T\bm TT(红色区域);剩余的弱反射连续的分布,在I\bm IIT\bm TT的亮度具有接近且较小的值(蓝色区域)。基于这种观察,网络ggg被设计为:使用ReLU6用于去除强反射产生的较大的值;ZC【Zreo-center】操作用于减少弱反射的影响。网络ggg使用自由偏置的卷积神经网络更好的将eeeI\bm II中传播。
real data
  图2,SIR数据的图示,从左至右:I\bm II, T\bm TT, ΦR\bm{\Phi R}ΦR。强或弱反射被红或蓝框标记。

  近似的,有ReLU6(ax+y)=aReLU6(x)+ReLU6(y)ReLU6(a\bm x+ \bm y) = aReLU6(\bm x) + ReLU6(\bm y)ReLU6(ax+y)=aReLU6(x)+ReLU6(y),其中标量aaa位于[0.7,1][0.7, 1][0.7,1]的范围,而x\bm xxy\bm yy是两个张量。本文的网络设计带来了如下近似:Ψi≈eΨi′+Δi,∀i=1,2,3,4,5(7)\bm\Psi_i \approx e\bm\Psi_i' + \bm\Delta_i, \forall i = 1, 2, 3, 4, 5 \tag 7ΨieΨi+Δi,i=1,2,3,4,5(7)其中,Ψ\bm\PsiΨ是如图1所示的隐藏层的输出,Δi\bm\Delta_iΔi定义为Δi={ΦR,i=0ZC(ReLU6(w∗Δi−1)),i=1,2,3,4,5(8)\bm\Delta_i = \left\{\begin{aligned}&\bm{\Phi R}, && i = 0 \\&ZC(ReLU6(\bm w*\bm\Delta_{i-1})), && i = 1, 2, 3, 4, 5 \\\end{aligned}\right.\tag 8Δi={ΦR,ZC(ReLU6(wΔi1)),i=0i=1,2,3,4,5(8)其中,w\bm ww是学习到的卷积核。ReLU6消除了大的值,ZC减去了平均值,因此Δi\bm\Delta_iΔi随着iii的增加趋近于零。随着Δi\bm\Delta_iΔiΦR\bm{\Phi R}ΦR得到信息,反射图像的内容随着Δi\bm\Delta_iΔi趋近于零而减少。式(7)表明eee可以在深层中顺利的传播。
  为了在训练中令Δi\bm\Delta_iΔi逼近于零,通过损失函数LΨiL_{\Psi}^iLΨi限制Ψ\bm\PsiΨ,形如LΨ=∑i=15λiLΨi=∑i=15λi∣∣BCE(Ψi/Ψi′,egt)∣∣(9)L_{\Psi} = \sum_{i=1}^5 \lambda_iL_{\Psi}^i = \sum_{i=1}^5 \lambda_i||BCE(\bm\Psi_i / \bm\Psi_i', e_{gt})||\tag 9LΨ=i=15λiLΨi=i=15λiBCE(Ψi/Ψi,egt)(9)其中,///为元素级除法,BCEBCEBCE代表二值交叉熵损失函数,应用于矩阵Ψi/Ψi′\bm\Psi_i / \bm\Psi_i'Ψi/Ψi与标量egte_{gt}egt,且λi\lambda_iλi为权重,值为{0.2,0.8,2,3,4}\{0.2, 0.8, 2, 3, 4\}{0.2,0.8,2,3,4}
  总而言之,二支训练策略准确的剥离了传播图像的内容特征。网络ggg与损失函数LψL_{\psi}Lψ消除了反射图像的内容影响。这些设计辅助eee通过神经网络ggg传播,得到了准确的估计。

4.2 传播图像复原
  网络h1h_1h1优化使得h1(I,e)=OTh_1(\bm I, e) = \bm{OT}h1(I,e)=OT成立。变量eee连续分布于整个空间,因此约束∀e∈E,h1(I,e)=OTs.t. I=fI(e)=eOT+ΦR(10)\begin{aligned} &\forall e \in \mathbb E, h_1(\bm I, e) = \bm{OT} \\ &s.t.\ \bm I = f_{\bm I}(e) = e\bm{OT} + \bm{\Phi R}\end{aligned} \tag{10}eE,h1(I,e)=OTs.t. I=fI(e)=eOT+ΦR(10)该约束确保了空间E\mathbb EE的所有eee都满足h1(I,e)=OTh_1(\bm I, e) = \bm{OT}h1(I,e)=OT而非某个单一值e0e_0e0,这用于泛化的先验学习不同的吸收效应。接下来说明式(10)的约束可以通过保证函数s(e)=fI(e),e∈Es(e) = f_{\bm I}(e), e \in \mathbb Es(e)=fI(e),eE是一个初始值问题{h1(s(e),e)=ds/deI0=s(e0)(11)\left\{\begin{aligned}&h_1(s(e), e) = ds/de \\&\bm I_0 = s(e_0) \\\end{aligned}\right. \tag{11}{h1(s(e),e)=ds/deI0=s(e0)(11)的唯一解达成,其中(I0,e0)(\bm I_0, e_0)(I0,e0)来源于训练数据。
  如果训练网络h1h_1h1使得fI(e)f_{\bm I}(e)fI(e)是式(11)中初始值问题的唯一解,那么有h1(fI(e),e)=ds/de=OTh_1(f_{\bm I}(e), e)=ds/de = \bm{OT}h1(fI(e),e)=ds/de=OT,而式(10)的约束也被保证。反之,s(e)s(e)s(e)的导数不能保证唯一,并且h1(s(e),e)h_1(s(e), e)h1(s(e),e)h1(I,e)h_1(\bm I, e)h1(I,e)不能必然等于OT\bm{OT}OT。因此,式(10)的约束不能确保满足。显然的,由于使用数据训练h1h_1h1用于满足fI(e)f_{\bm I}(e)fI(e)fI(e)f_{\bm I}(e)fI(e)是式(11)中初始值问题的一个解。因此,确保式(10)约束的关键在于解fI(e)f_{\bm I}(e)fI(e)的单值性。
  根据柯西-利普希茨【Cauchy-Lipschitz】理论,只有h1h_1h1满足利普希茨条件的约束,才可以得到唯一解。给定I∈U\bm I \in \mathbb UIU,利普希茨条件表示为∣h1(I1,e)−h1(I2,e)∣≤M∣I1−I2∣,∀(I1,e),(I2,e)∈U×E(12)|h_1(\bm I_1, e) - h_1(\bm I_2, e)| \le M|\bm I_1 - \bm I_2|, \forall (\bm I_1, e), (\bm I_2, e) \in \mathbb U \times \mathbb E \tag{12}h1(I1,e)h1(I2,e)MI1I2,(I1,e),(I2,e)U×E(12)其中MMM是利普希茨常数。如果函数h1h_1h1满足式(12),称之为M-利普希茨函数,本文设置MMM为1。深度神经网络可以使用梯度惩罚实现利普希茨条件约束,可微函数是一个1-利普希茨函数当且仅当其梯度的范数至多为1。
  相似的,限制h2h_2h2为1-利普希茨可微函数,例如使用梯度惩罚函数,惩罚反射失真图像I^\hat\bm II^的梯度LCon=(∣∣∇I^h1(I^,e^)∣∣−1)2,∀I^∈U,∀e^∈E(13)L_{Con} = (||\nabla_{\hat\bm I} h_1(\hat\bm I, \hat e)|| - 1)^2, \forall \hat\bm I \in \mathbb U, \forall \hat e \in \mathbb E \tag{13}LCon=(I^h1(I^,e^)1)2,I^U,e^E(13)其中U\mathbb UU代表反射失真图像的子空间。构建I^=I+ϵ1OT\hat\bm I = \bm I + \epsilon_1\bm{OT}I^=I+ϵ1OT,其中ϵ1∼U[−0.1,0.1]\epsilon_1 \sim U[-0.1, 0.1]ϵ1U[0.1,0.1],其中UUU代表均匀分布。这使得I^=(ϵ1+e)OT+ΦR\hat\bm I = (\epsilon_1 + e)\bm{OT} + \bm{\Phi R}I^=(ϵ1+e)OT+ΦR是带有吸收效应ϵ1+e\epsilon_1 + eϵ1+e的反射失真图像。因此,有I^∈U\hat\bm I \in \mathbb UI^U。构建E={e^∣e^=ϵ2egt+(1−ϵ2)epre}\mathbb E = \{\hat e|\hat e = \epsilon_2e_{gt} + (1 - \epsilon_2)e_{pre}\}E={e^e^=ϵ2egt+(1ϵ2)epre},其中ϵ2∼U[0,1]\epsilon_2 \sim U[0, 1]ϵ2U[0,1]。这种构造线性的采样真实和估计分布。
  将h1h_1h1h2h_2h2网络连接为hhh,并将梯度惩罚损失函数应用到hhh以近似的应用到h1h_1h1。这样的近似是有理由的,因为hhh的梯度被惩罚代表h1h_1h1的梯度也期望被惩罚。
  梯度惩罚损失函数保证了式(11)初始值问题的唯一解,从而确保了式(10)的约束,有助于泛化学习具有不同吸收效应与场景的有限的训练数据与真实数据。

4.3 损失函数
  本文使用交替优化的策略迭代的训练ggghhh。为了更好的考虑吸收效应估计,更新ggg一次之后更新hhh五次。ggghhh的损失函数分别为Lg=LT+λe(Le+Le′)+∑i=15λiLΨiLh=LT+λgpLCon(14)\begin{aligned}& L_g = L_T + \lambda_e(L_e + L_e') + \sum_{i=1}^5\lambda_iL_{\Psi}^i \\ & L_h = L_T + \lambda_{gp}L_{Con}\end{aligned} \tag{14}Lg=LT+λe(Le+Le)+i=15λiLΨiLh=LT+λgpLCon(14)其中LTL_TLT是复原损失函数,LeL_eLe是二值交叉熵损失函数LT=D(Tpre,Tgt),Le=BCE(epre,egt),Le′=BCE(epre′,1)(15)L_T = D(\bm T_{pre}, \bm T_{gt}), L_e = BCE(e_{pre}, e_{gt}), L_e' = BCE(e_{pre}', 1) \tag{15}LT=D(Tpre,Tgt),Le=BCE(epre,egt),Le=BCE(epre,1)(15)其中,Tpre=h(I,epre)\bm T_{pre} = h(\bm I, e_{pre})Tpre=h(I,epre)epre=g(I)e_{pre} = g(\bm I)epre=g(I)DDD是一个预定义的度量,用于衡量Tpre\bm T_{pre}TpreTgt\bm T_{gt}Tgt的相似度D(Tpre,Tgt)=lper−λpsnrlLSNR−lSSIM−lSI(16)D(\bm T_{pre}, \bm T_{gt}) = l_{per} - \lambda_{psnr}l_{LSNR} - l_{SSIM} - l_{SI} \tag{16}D(Tpre,Tgt)=lperλpsnrlLSNRlSSIMlSI(16)其中,λpsnr\lambda_{psnr}λpsnr设置为1/401/401/40用于平衡lSSIMl_{SSIM}lSSIMlSIl_{SI}lSI的值。预定义的度量DDD综合考虑常见的适合的度量,如VGG-16模型中的感知损失lperl_{per}lper;峰值信噪比【Peak Signal-to-Noise Ratio,PSNR】与结构相似性【Structural SIMilarity,SSIM】也广泛用于衡量图像的差异。
  图1展示了ggghhh的网络架构,批尺寸为16,λe=0.5\lambda_e = 0.5λe=0.5λgp=10\lambda_{gp} = 10λgp=10,使用Adam优化器,参数为β1=0.5,β2=0.999\beta_1 = 0.5, \beta_2 = 0.999β1=0.5,β2=0.999。起始100轮次的学习率为0.0001,并在接下来的100轮次中衰减到0.00005。


五、实验
  使用四个真实的数据集进行评估,其具有不同的吸收效应(已于第三章介绍)。SIR数据集包含454个测试样本且其中的120个通过三种不同厚度的玻璃获取,本文使用SIR的子集:厚SIR;ZC20数据集包含160个具有使用五种不同方位的玻璃获取的样本;LY20数据集包含220个样本,部分由两种不同厚度与不同方位的玻璃获取;ZN18数据集包含109个测试样本,部分由两种不同方位的玻璃获取。
  本文比较的方案包含七种SOTA的图像反射去除方案,包括基于优化的YM19,与基于深度学习的ZN18,WS19,WY19,WT19,KH20,LY20。
  度量方案使用SSIM与PSNR作为误差度量。此外,引入亮度相似性指数均值【average of Intensity Similarity index,IS】评估精确的全局亮度相似性。本文的关键之处为吸收效应eee,亮度相似性聚焦于图像x\bm xxy\bm yy的亮度相似度,其定义为SSIM的一个因子IS(x,y)=2μxμy+cμx2+μy2+c(17)IS(\bm x, \bm y) = \frac{2\mu_x\mu_y + c}{\mu_x^2 + \mu_y^2 + c} \tag{17}IS(x,y)=μx2+μy2+c2μxμy+c(17)其中μx\mu_xμxx\bm xx的均值,μy\mu_yμy同理。ccc是一个默认值的常数。

5.1 合成训练数据
  基于式(1),使用Place365的18224个样本作为T\bm TT,来自CRRN的5552个样本作为R\bm RR,通过蒙特卡洛仿真形成的18224组{Ω,Φ}\{\bm\Omega, \bm\Phi\}{Ω,Φ}生成数据集。相机模型由图3.a展示。有工作表明水平全视野相机pfp_fpf(设输入尺寸比例2:3)、折射率K\mathcal KK、玻璃的方位(由po1p_{o1}po1po2p_{o2}po2的三角函数及其运算代表)共同决定了Ω\bm\OmegaΩΦ\bm\PhiΦ。其他的工作假设A=0\bm A = 0A=0但本文将A\bm AA的估计考虑在内,此外本文考虑玻璃的宽度pwp_wpw、相机与玻璃的距离pdp_dpd、玻璃的厚度ptp_tpt以及玻璃的衰减系数kkk。这些输入通过蒙特卡洛仿真基于均匀分布生成。图3.b展示了本文使用的变量范围,其根据日常生活的观察设定。
  为了展示吸收效应可以被Ω\bm\OmegaΩ的均值量化的估计,本文额外生成了10000组{Ω,Φ,A}\{\bm\Omega, \bm\Phi, \bm A\}{Ω,Φ,A}用于分析。注意到,根据式(3),对于不同的入射角度,A\bm AA的所有元素都趋于一致。其可以表示为a=fA(θ,k,L)a = f_A(\theta, k, L)a=fA(θ,k,L),如图3.c所示,其中aaaA\bm AA的元素,θ\thetaθ是对应的入射角,kkkLLL满足所给的I\bm II(假设光滑玻璃)。定义吸收代数η=avg(A)\eta = avg(\bm A)η=avg(A),那么η\etaη可以近似的代表吸收系数A\bm AA。本文研究了η\etaη{Ω,Φ}\{\bm\Omega, \bm\Phi\}{Ω,Φ}的关系,图3.d与3.e展示了10000组{η,avg(Ω),std(Ω),avg(Φ),std(Ω)}\{\eta, avg(\bm\Omega), std(\bm\Omega), avg(\bm\Phi), std(\bm\Omega)\}{η,avg(Ω),std(Ω),avg(Φ),std(Ω)}的仿真结果。η\etaη广泛的分布表明了真实世界吸收效应的波动。对应的,avg(Φ)avg(\bm\Phi)avg(Φ)std(Φ)std(\bm\Phi)std(Φ)狭窄的分布表明η\etaηΦ\bm\PhiΦ的较弱的关系。且由于std(Ω)std(\bm\Omega)std(Ω)的狭窄分布及其较小值,Ω\bm\OmegaΩ的元素趋于一致。因此定义e=avg(Ω)e = avg(\bm\Omega)e=avg(Ω)并聚焦于eeeη\etaη的关系。图3.f展示了其关系的分析,基于eeeη\etaη的双射,使用eee作为吸收效应的量化估计。
MCsim
  图3,a.蒙特卡洛仿真的相机模型;b.蒙特卡洛仿真输入变量的分布与单位;c.函数a=fA(θ,k,L)a = f_A(\theta, k, L)a=fA(θ,k,L)曲线,其中aaaA\bm AA的元素,θ\thetaθ是对应的入射角,L=9mmL = 9mmL=9mm;d与e.10000个随机生成的η\etaηΩ\bm\OmegaΩΦ\bm\PhiΦ的均值与方差的分布;f.吸收代数η\etaηeee的相关性分析结果。

5.2 图像模型验证
  使用本文的数据集重新训练的基于学习的方法,并在测试集上比较预训练的模型。由于本文与相关工作的生成图像模型不同,表现结果只是用于评估图像模型的有效性。表1展示了重训练与预训练模型的平均SSIM。可以观察到,重训练模型的27种情况中,24项相比之下表现更优。
在这里插入图片描述

  表1,重训练与预训练的平均SSIM差异(×10−3\times 10^{-3}×103),正数表示表现改善。/表示指定方法的模型使用指定数据集训练。

5.3 全局表现
  表2展示了每个测试集上预训练与重训练模型中更好的指标。可以观察到,所有的数据集中,本文的方法都达到了最好的表现。图4展示了视觉上的质量比较。可以观察到,YM19产生过于平滑的结果;ZN18图像复原时产生了颜色失真;WS19推测了更暗的结果;WT19、WY19、KH20与LY20没有移除反射失真,并产生了不准确的全局亮度。相比之下,本文不仅移除了反射失真,且复原了由于吸收效应产生的亮度失真。本文的方法基于考虑吸收效应,达到了SOTA的效果。
data
  表2,对于反射失真移除任务,不同数据集上各个模型不同指标的比较。最好与次好的表现分别标记为红色与蓝色。

在这里插入图片描述
  图4,不同数据集上各个模型的视觉质量比较。颜色框标记了较显著的差异。

5.4 剪切学习
  为了验证本文方法各部分的有效性,使用两种方法:单支方法,网络ggg仅将I\bm II作为输入并在训练中不使用损失函数LψL_{\psi}Lψ;w/o-Con方法,网络hhh不使用式(10)(10)(10)的约束条件以及损失函数LgpL_{gp}Lgp
  如表2与图4所示,参考IS,两支训练有助于估计更加准确的eee,使得T\bm TT的全局亮度更加准确的还原。图5左可以更加的显示不同测试集下的IS分布。可以观察到,本文的方法表现优于单支方法与其他SOTA方法。如图5右的视觉质量比较展示了本文方法更加准确的考虑到全局亮度并复原T\bm TT
one-bench
  图5,左:不同测试集上所有测试样本上各个模型的IS;右:各个模型的预测图像与真实图像的IS图,其对应图像如图4所示。颜色狂标记了较显著的不同。

  网络hhh满足利普希茨条件可以满足式(10)的约束从而提高泛化能力。如表2与图4所示,本文的方法较w/o-Con方法稍有更好的结果。为了验证其优势,减少训练样本,这可以突出数据驱动方法泛化能力。分别使用1/101/101/101/201/201/20的样本,分别称为中型与小型,而原始数据量称为大型。基于eee的约束,使用IS作为度量。图6展示了不同训练集尺寸的变化。可以观察到,本文的方法较w/o-Con方法的泛化能力更强。
w/o-Con
  图6,本文方法(红色曲线)与w/o-Con方法(蓝色曲线)在不同数据集上使用不同尺寸数据集(大,中,小型)的IS结果。


六、结论
  本文重建了吸收效应的图像模型,并提出两步解决方案用于反射失真去除,达到了SOTA的效果。然而,由于从I\bm II中估计吸收效应eee是一个不适定问题,eee的估计是不准确的。其受到未知图像内容与相机的图像信号处理过程的不确定影响。另一方面,吸收效应的简化使得使用真实数据直接验证模型变得困难。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值