Introduction
噪声水平估计对于非盲去噪方法是至关重要的,噪声水平估计质量直接影响去噪的质量。这篇文章是2015年ICCV 的一篇文章,针对于加性高斯白噪声,其利用非局部相似块具有低秩性的特性,利用协方差矩阵冗余维度的特征值估计噪声水平,并取得了不错的效果。这篇文章的主要贡献在于
- 分析了噪声水平和图像patch的协方差矩阵的特征值之间的关系;
- 提出了一种无参方法在多项式时间内从特征值估计噪声水平的方法,并给与了理论证明;
Analysis
这篇文章的方法是针对于加性,独立,同质性的高斯噪声。所谓“同质性”指的是噪声方差对于图像中所有像素都是一个常数,不会随着位置和颜色强度改变。由于一般认为图像的噪声都是零均值噪声,所谓的噪声水平估计就是通过单张噪声图像估计高斯噪声的方差(或标准差)。
该文章的方法是基于以下观察:从无噪声图像中提取的patch常常处于一个低维子空间中,而不是均匀分布于所有空间中。所以噪声的方差就可以从冗余的空间维度上进行估计,那么噪声估计问题就变成了如何选择冗余维度的问题。
Method
把一张图像分解为一系列的patchXs={xt}t=1s∈Rr×sX_s=\{x_t\}^s_{t=1}\in\mathbb{R}^{r\times s}Xs={xt}t=1s∈Rr×s。如果图像大小为M×N×cM\times N\times cM×N×c,则XsX_sXs包含s=(M−d+1)(N−d+1)s=(M-d+1)(N-d+1)s=(M−d+1)(N−d+1)个大小为d×d×cd\times d\times cd×d×c的patch。然后将所有这些patch都变成向量,其维度为r=cd2r=cd^2r=cd2。对于集XsX_sXs中任意一个向量xtx_txt,其可以分解为:
xt=x^t+etx_t=\hat{x}_t+e_txt=x^t+et
其中,x^t\hat{x}_tx^t是对应的无噪声图像patch,ete_tet表示加性高斯白噪声,et∼Nr(0,σ2I)e_t\sim N_r(0,\sigma ^2I)et∼Nr(0,σ2I)。
特征值
从下图中可以看出,无噪声图像patch的特征值多数为0(即说明其位于低维子空间),而噪声图像patch的特征值多数位于真实噪声方差50附近,但不是精确为50。
所以如何精确的获得噪声方差是需要解决的问题。
计算xtx_txt的协方差矩阵可得
Σx=1s∑t=1s(xt−μ)(xt−μ)T\Sigma_x=\frac{1}{s}\sum^s_{t=1}(x_t-\mu)(x_t-\mu)^TΣx=s1t=1∑s(xt−μ)(xt−μ)T
其中,μ=1s∑t=1sxt\mu=\frac{1}{s}\sum^s_{t=1}x_tμ=s1∑t=1sxt为其平均值。
对其做特征值分解可得
Σx=RΛRT=R[λ10⋯00λ2⋯0⋮⋮⋱⋮00⋯λr]RT\Sigma_x=R\Lambda R^T=
R\left[\begin{matrix}
\lambda_1 & 0 & \cdots & 0 \\
0 & \lambda_2 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & \lambda_r \\
\end{matrix}\right]R^TΣx=RΛRT=R⎣⎢⎢⎢⎡λ10⋮00λ2⋮0⋯⋯⋱⋯00⋮λr⎦⎥⎥⎥⎤RT
则xtx_txt可以表示为(此处yty_tyt与原文表达意思不同)
xt=Rytx_t=Ry_txt=Ryt
假设干净的patch位于mmm维线性空间中,m≪rm\ll rm≪r,则
x^t=Ay^t\hat{x}_t=A\hat{y}_tx^t=Ay^t
其中,R=[A,U]R=[A,U]R=[A,U],A∈Rr×mA\in \mathbb{R}^{r\times m}A∈Rr×m表示mmm维的子空间。
综上可知,
xt=Ryt=R[y^t,0]+et=[A,U][y^t,0]+etx_t=Ry_t=R\left[ \begin{matrix} \hat{y}_t,\\ \mathbf{0}\\ \end{matrix}\right]+e_t=\left[ A,U \right] \left[ \begin{matrix} \hat{y}_t,\\ \mathbf{0}\\ \end{matrix}\right]+e_txt=Ryt=R[y^t,0]+et=[A,U][y^t,0]+et
公式两边乘以RTR^TRT
RTxt=[y^t,0]+RTet=[y^t+ATet,UTet]R^Tx_t=\left[ \begin{matrix} \hat{y}_t,\\ \mathbf{0}\\ \end{matrix}\right]+R^Te_t=\left[ \begin{matrix} \hat{y}_t+A^Te_t,\\ U^Te_t\end{matrix}\right]RTxt=[y^t,0]+RTet=[y^t+ATet,UTet]
通过RTR^TRT将噪声部分ete_tet从xtx_txt中分离出来,且根据高斯函数性质,nt=UTetn_t=U^Te_tnt=UTet是服从高斯分布Nr−m(0,σ2I)N_{r-m}(0,\sigma^2I)Nr−m(0,σ2I)的随机变量。
RTxtR^Tx_tRTxt的协方差为
1s∑t=1s(RTxt)(RTxt)T=RTΣxR=Λ\frac{1}{s}\sum^s_{t=1}(R^Tx_t)(R^Tx_t)^T=R^T\Sigma_xR=\Lambdas1t=1∑s(RTxt)(RTxt)T=RTΣxR=Λ
为了估计噪声方差,将特征值S={λi}i=1rS=\{\lambda_i\}^r_{i=1}S={λi}i=1r分成两个部分,其中,S1={λ1}i=1mS_1=\{\lambda_1\}^m_{i=1}S1={λ1}i=1m表示主维度的特征值,S2={λ1}i=m+1rS_2=\{\lambda_1\}^r_{i=m+1}S2={λ1}i=m+1r表示冗余维度的特征值。用冗余维度的特征值估计噪声方差。
由于冗余维度向量nt=UTetn_t=U^Te_tnt=UTet服从高斯分布Nr−m(0,σ2I)N_{r-m}(0,\sigma^2I)Nr−m(0,σ2I),对于向量ntn_tnt中的每一个元素nt[i]n_t[i]nt[i]也是服从高斯分布N(0,\sigma^2)的随机变量,由于
λi=1s∑t=1snt[i]2,i∈m+1,m+2,..,r\lambda_i=\frac{1}{s}\sum^s_{t=1}n_t[i]^2, i\in{m+1,m+2,..,r}λi=s1t=1∑snt[i]2,i∈m+1,m+2,..,r
则特征值λi∈S2\lambda_i\in S_2λi∈S2也是均值为噪声方差σ2\sigma^2σ2的随机变量。
这里放上文章中的引理:
维度选择
下图表示噪声图像特征值的直方图,可以看出除了少数比较大的异常值(主维度的特征值)以外,其余的特征值是服从高斯分布的,且根据上面的引理,其均值(期望)就是噪声方差。
所以现在的任务就是估计主维度的数量,去除其特征值,即判断特征值是否属于S2S_2S2。
放上文章另一个定理
其说明,当集合SSS中的冗余维度足够多时,可以通过判断SSS的平均值与其中值是否相等,来判断SSS是否存在异常值。我是从另一个角度理解的,由于冗余维度的特征值服从高斯分布,高斯分布的均值等于其中值,而异常值的存在破坏了这种等价关系,随着异常值的剔除,其中值和均值逐渐接近。
在文章中,patch大小设为8×88\times 88×8,则X={xt}t=1sX=\{x_t\}^s_{t=1}X={xt}t=1s维度为192,则主维度的数量不能超过67(具体证明可参见原文)。
算法
根据以上分析,则可以得到噪声水平估计算法,总体来说,就是通过剔除SSS中的异常值,得到冗余维度的特征值,然后冗余维度的特征值的期望(均值)就是噪声的方差。