加权核范数最小化（WNNM算法）

最新推荐文章于 2024-09-18 15:33:13 发布

巴拉马拉

最新推荐文章于 2024-09-18 15:33:13 发布

阅读量2.2k

点赞数 12

文章标签：算法图像处理

本文链接：https://blog.youkuaiyun.com/weixin_48999757/article/details/140049260

版权

Weighted Nuclear Norm Minimization with Application to Image Denoising

研究背景

核范数平等的正则化每一个奇异值，限制了处理实际问题的能力，在实际情况中，奇异值具有明确的物理意义，应该用不同的方式对待，更大的奇异值通常与主要投影元素有关，因此最好缩小得更少。因此本文研究了加权核范数最小化，给奇异值分配不同的权重，并且利用图像非局部自相似性将WNNM算法用于图像去噪。

加权核范数

为了提高核范数的灵活性，提出了加权核范数并研究了其极小化问题。矩阵X的加权核范数定义为
$\|X\|_{w,*}=\sum_i|w_i\sigma_i(X)|_1,$
式中： $\boldsymbol{w}=[w_1,\ldots,w_n]$ ， $w_{i}\geq0$ 为分配给 $\sigma_i(X)$ 的非负权重。因此NNM的求解
$\hat{X}=\arg\min_X\|Y-X\|_F^2+\lambda\|X\|_*,\quad(1)$
就可以变成：
$\min_X\|\boldsymbol{Y}-\boldsymbol{X}\|_F^2+\|\boldsymbol{X}\|_{\boldsymbol{W},*}.\quad(2)$
然而，由于( 2 )式中的目标函数一般不是凸的，因此WNNM问题比NNM更难优化。次梯度条件不再满足，类似的推导无法应用于WNNM。

WNNM的最优化过程

在分析WNNM的优化之前，我们首先给出了以下三个引理

**引理1 **： $\forall A,B\in\Re^{m\times n}$ ，当满足 $A^{T}B=0$ 时，我们有
$\begin{aligned}&(1)\|A+B\|_{w,*}\geq\|A\|_{w,*};\\&(2)\|A+B\|_F\geq\|A\|_F.\end{aligned}$

证明：(1) $:\|A+B\|_{w,*}\geq\|A\|_{w,*}$

首先，考虑矩阵𝐴和 𝐵的奇异值分解：

$A=U_A\Sigma_AV_A^T,\quad B=U_B\Sigma_BV_B^T,$

由于 $A^TB=0$ ,则
$V_A\Sigma_A^TU_A^TU_B\Sigma_BV_B^T=0.$
这意味着 $U_A^TU_B$ 是一个零矩阵，因为 $\Sigma_{A}$ 和 $\Sigma_{B}$ 是对角矩阵且非零元素不同。

因此， $U_{A}$ 和 $U_{B}$ 是正交的基，即 $U_{A}^{T}U_{B}=0$ 和 $V_A^TV_B=0$ 。这使得 𝐴 和 𝐵的奇异值向量可以直接相加：
$\Sigma_{A+B}=\sqrt{\Sigma_A^2+\Sigma_B^2}.$
因此，对于 𝐴+𝐵的加权奇异值范数有：
$\|A+B\|_{w,*}=\sum_i|w_i\sigma_i(A+B)|=\sum_i|w_i\sqrt{\sigma_i(A)^2+\sigma_i(B)^2}|.$
由于 $\sqrt{\sigma_i(A)^2+\sigma_i(B)^2}\geq\sigma_i(A)$ ，且 $w_{i}\geq0$ ，所以
$\sum_i|w_i\sqrt{\sigma_i(A)^2+\sigma_i(B)^2}|\geq\sum_i|w_i\sigma_i(A)|=\|A\|_{w,*}.$
因此得证 $\|A+B\|_{w,*}\geq\|A\|_{w,*}.$

(2): $\|A+B\|_F\geq\|A\|_F$

Frobenius 范数定义为：
$\|X\|_F=\sqrt{\sum_{i,j}X_{ij}^2}.$
所以原式证明可以转化为：
$\|A+B\|_F^2\geq\|A\|_F^2.$
首先计算 $A+B\|_F^2$ :
$\|A+B\|_F^2=\sum_{i,j}(A_{ij}+B_{ij})^2 =\sum_{i,j}(A_{ij}^2+2A_{ij}B_{ij}+B_{ij}^2).$
因为 $A^{T}B=0{:}$ ，所以 $\sum_{i,j}A_{ij}B_{ij}=0$
$\|A+B\|_F^2=\sum_{i,j}(A_{ij}^2+2A_{ij}B_{ij}+B_{ij}^2)=\sum_{i,j}A_{ij}^2+\sum_{i,j}B_{ij}^2+2\cdot0=\|A\|_F^2+\|B\|_F^2.$
又因为 $\|B\|_{F}^{2}\geq0$ ，所以
$\|A+B\|_F^2\geq\|A\|_F^2,$
去平方根后得证.

引理2： $\forall\boldsymbol{M}=\left[\begin{array}{cc}A&B\\C&D\end{array}\right]$ ，其中 $A\in\Re^{m\times m}$ 、$\boldsymbol{D}\in\Re^{n\times n} $，如果权重满足$ w_{1}\geq\cdot\cdot\cdot\geq w_{m+n}\geq0$，可得
$\|M\|_{w,*}\geq\|A\|_{{w_{1},*}}+\|D\|_{{w_{2},*}},$
其中 $\boldsymbol{w}=[w_1,\ldots,w_{m+n}]$ ， $\boldsymbol{w}_1=[w_1,\ldots,w_m]$ 、 $\boldsymbol{w}_2=[w_{m+1},\ldots,w_{m+n}]$

证明：

对于分块矩阵M，其奇异值与其子块矩阵 𝐴A 和 𝐷D 的奇异值满足如下关系：

假设 $\sigma_i(X)$ 表示矩阵 𝑋的第 𝑖大奇异值，那么有
$\sigma_i(\boldsymbol{M})\geq\sigma_i(A)\quad\mathrm{for~}i=1,2,\ldots,m\\\sigma_i(\boldsymbol{M})\geq\sigma_i(D)\quad\mathrm{for~}i=1,2,\ldots,n$
利用上述不等式和权重 $w_{i}$ 的非递增性，我们可以得出：
$\begin{aligned}\|\boldsymbol{M}\|_{w,*}&=\sum_{i=1}^{m+n}w_i\sigma_i(\boldsymbol{M})\\\|A\|_{w_1,*}&=\sum_{i=1}^mw_i\sigma_i(A)\\\|D\|_{w_2,*}&=\sum_{i=1}^nw_{m+i}\sigma_i(D)\end{aligned}$
分别对 𝐴和 𝐷的奇异值与其对应权重乘积求和:
$\sum_{i=1}^mw_i\sigma_i(A)\leq\sum_{i=1}^mw_i\sigma_i(\boldsymbol{M})\\\sum_{i=1}^nw_{m+i}\sigma_i(D)\leq\sum_{i=1}^nw_{m+i}\sigma_{m+i}(\boldsymbol{M})$
所以 $\|\boldsymbol{M}\|_{w,*}\geq\|A\|_{w_1,*}+\|D\|_{w_2,*}$ ，得证

引理3 .设 $\forall A\in\Re^{n\times n}$ ，和具有非升序的有序对角元的对角非负矩阵 $\boldsymbol{W}\in\Re^{n\times n}$ 。令 $\boldsymbol{A}=\boldsymbol{X}\boldsymbol{\Phi}\boldsymbol{Y}^{T}$ 是A的奇异值分解，有
$\sum_i\sigma_i(A)\sigma_i(W)=\max_{\boldsymbol{U}^T\boldsymbol{U}=\boldsymbol{I},\boldsymbol{V}^T\boldsymbol{V}=\boldsymbol{I}}tr[\boldsymbol{W}\boldsymbol{U}^T\boldsymbol{A}\boldsymbol{V}],$
其中I是单位矩阵， $\sigma_i(A)$ 和 $\sigma_i(W)$ 分别是矩阵A和W的第i个奇异值.当U = X，V = Y时， $tr[\boldsymbol{WU}^T\boldsymbol{AV}]$ 达到最大值。

证明：

需要证明当 U=X 和 V**=Y 时， $\operatorname{tr}[\boldsymbol{WU}^T\boldsymbol{AV}]$ 达到最大值。

利用一个重要的矩阵分析结果，即对于任何对角矩阵 D 和任意正交矩阵 P，有
$\operatorname{tr}[\boldsymbol{DP}]\leq\sum_id_i\lambda_i(\boldsymbol{P}),$
其中 𝑑𝑖是 𝐷的对角元，而 𝜆𝑖(𝑃) 是 𝑃的奇异值。

当 𝑃P 是正交矩阵时，其奇异值都是 1，所以对任意正交矩阵𝑈和 𝑉，有
$\operatorname{tr}[\boldsymbol{W}\boldsymbol{U}^T\boldsymbol{A}\boldsymbol{V}]\leq\sum_{i=1}^nw_i\sigma_i(A).$
当 U**=X、**V=Y 时，这个上界可以达到，因为此时
$KaTeX parse error: Can't use function '$' in math mode at position 106: …oldsymbol{AY}]=$̲\mathrm{tr}[\bo…$

**定理1：**令 $\forall Y\in\Re^{m\times n},$ ，用 $Y=U\boldsymbol{\Sigma}V^T$ 表示其SVD。对于(2)式中权重向量w非负的WNNM问题，其解 $\hat{\boldsymbol{X}}$ 可写为 $\hat{X}=U\hat{\boldsymbol{B}}V^T$ ，其中 $\hat{\boldsymbol{B}}$ 为下面优化问题的解
$\hat{\boldsymbol{B}}=\arg\min_{\boldsymbol{B}}\|\boldsymbol{\Sigma}-\boldsymbol{B}\|_F^2+\|\boldsymbol{B}\|_{\boldsymbol{w},*}.\quad(3)$

证明：用 $U_{\perp}$ 表示U的补空间的正交基集合

令 $X=UA_{1}+U_\perp A_2$ ，式中： $A_{1}$ 和 $A_{2}$ 分别为X在子空间U和 $U_{\perp}$ 中的分量。那么我们就有了
$\begin{aligned}f(\boldsymbol{X})=&\|\boldsymbol{Y}-\boldsymbol{X}\|_F^2+\|\boldsymbol{X}\|_{\boldsymbol{w},*}\\=&\|\boldsymbol{U}\boldsymbol{\Sigma}V^T-\boldsymbol{U}\boldsymbol{A}_1-\boldsymbol{U}_\perp\boldsymbol{A}_2\|_F^2+\|\boldsymbol{U}\boldsymbol{A}_1+\boldsymbol{U}_\perp\boldsymbol{A}_2\|_{\boldsymbol{w},*}\\\geq&\|\boldsymbol{U}\boldsymbol{\Sigma}V^T-\boldsymbol{U}\boldsymbol{A}_1\|_F^2+\|\boldsymbol{U}\boldsymbol{A}_1\|_{\boldsymbol{w},*}\quad(Lemma\quad\boxed{1}).\end{aligned}$
类似地，对于行空间基V，有
$f(\boldsymbol{X})\geq\|\boldsymbol{U}\boldsymbol{\Sigma}\boldsymbol{V}^T-\boldsymbol{U}\boldsymbol{B}\boldsymbol{V}^T\|_F^2+\lambda\|\boldsymbol{U}\boldsymbol{B}\boldsymbol{V}^T\|_{\boldsymbol{w},*}.$
正交矩阵U和V不会改变F -范数和加权核范数，因此有
$f(X)\geq\|\Sigma-B\|_F^2+\lambda\|B\|_{w,*}.$
因此，如果我们有(3)中极小化问题的解，那么( 2 )中原始WNNM问题的解可以表示为 $\hat{X}=U\hat{\boldsymbol{B}}V^T$ .

基于上述引理和定理，我们分3种情况讨论WNNM问题的解：权重 $w_1\geq\cdot\cdot\cdot\geq w_n\geq0$ 分别为非升序、任意序和非降序。

非升序

根据定理1，当 $w_1\geq\cdot\cdot\cdot\geq w_n\geq0$ 时，有(2)式中WNNM问题的全局最优解。我们有如下定理。

定理2：若权重满足 $w_1\geq\cdot\cdot\cdot\geq w_n\geq0$ ，则式( 2 )中的WNNM问题存在全局最优解：
$\hat{X}=U\mathcal{S}_w(\Sigma)V^T,$
式中： $Y=U\Sigma V^T$ 为Y的SVD， $\mathcal{S}_w(\boldsymbol{\Sigma})$ 为带权向量w的广义软阈值算子
$\mathcal{S}_{\mathbf{w}}(\boldsymbol{\Sigma})_{ii}=\max(\boldsymbol{\Sigma}_{ii}-w_i,0).$
证明:考虑(3)中的优化问题，假设 $\boldsymbol{\Lambda_{B}}$ 是对角矩阵，且 $\boldsymbol{\Lambda_{B}}$ 的对角元素与矩阵B的对角元素相同，我们有
$\begin{aligned}&\|\boldsymbol{\Sigma}-\boldsymbol{B}\|_F^2+\lambda\|\boldsymbol{B}\|_{\boldsymbol{w},*}\\=&\|\boldsymbol{\Sigma}-\boldsymbol{\Lambda}_{\boldsymbol{B}}-(\boldsymbol{B}-\boldsymbol{\Lambda}_{\boldsymbol{B}})\|_{F}^{2}+\|\boldsymbol{\Lambda}_{\boldsymbol{B}}+(\boldsymbol{B}-\boldsymbol{\Lambda}_{\boldsymbol{B}})\|_{\boldsymbol{w},*}\\\geq&|\boldsymbol{\Sigma}-\boldsymbol{\Lambda}_{\boldsymbol{B}}\|_F^2+\|\boldsymbol{\Lambda}_{\boldsymbol{B}}\|_{\boldsymbol{w},*}&(Lemma\quad\boxed{2}).\end{aligned}$
因此，在这样的权重条件下，( 3 )式的最优解具有对角形式 $\boldsymbol{\Lambda_{B}}$ 。Σ和 $\boldsymbol{\Lambda_{B}}$ 都是对角矩阵，可以通过对每个元素进行软阈值操作得到解。根据定理1的结论，( 2 )式的最优解为 $\hat{\boldsymbol{X}}=\boldsymbol{U}\mathcal{S}_{\boldsymbol{w}}(\boldsymbol{\Sigma})\boldsymbol{V}^T$ 。

任意顺序

在权重 $w_{i=1\cdots n}$ 不是非升序而是任意序的情况下，( 5 )中的WNNM问题是非凸的，因此不能有全局最小值。我们提出了一个迭代算法来求解它

在定理1中，我们已经证明了( 2 )的解可以通过求解( 3 )得到。令 $B=P\Lambda Q^T$ 为B的奇异值分解。我们迭代求解下面的优化问题
$\begin{aligned}(\hat{\boldsymbol{P}},\hat{\boldsymbol{\Lambda}},\hat{\boldsymbol{Q}})&=\arg\min_{\boldsymbol{P},\boldsymbol{\Lambda},\boldsymbol{Q}}\|\boldsymbol{P}\boldsymbol{\Lambda}\boldsymbol{Q}^T-\boldsymbol{\Sigma}\|_F^2+\|\boldsymbol{P}\boldsymbol{\Lambda}\boldsymbol{Q}^T\|_{\boldsymbol{W},*},\\&s.t.\boldsymbol{P}^T\boldsymbol{P}=\boldsymbol{I},\boldsymbol{Q}^T\boldsymbol{Q}=\boldsymbol{I}\end{aligned}\quad(4)$
迭代过程：

给定非负对角矩阵Λ，我们求解
$(\hat{\boldsymbol{P}},\hat{\boldsymbol{Q}})=\arg\min_{\boldsymbol{P},\boldsymbol{Q}}\|\boldsymbol{P\Lambda Q}^T-\boldsymbol{\Sigma}\|_F^2$
基于Frobenius范数的定义，有
$\begin{aligned} &\min_{\boldsymbol{P},\boldsymbol{Q}}\|\boldsymbol{P\Lambda Q}^T-\boldsymbol{\Sigma}\|_F^2 \\ &= \min_{\boldsymbol{P},\boldsymbol{Q}}tr[(\boldsymbol{P\Lambda Q}^T-\boldsymbol{\Sigma})(\boldsymbol{P\Lambda Q}^T-\boldsymbol{\Sigma})^T] \\ &= tr[\boldsymbol{\Lambda}\boldsymbol{\Lambda}+\boldsymbol{\Sigma}\boldsymbol{\Sigma}]-2\operatorname*{max}_{\boldsymbol{P},\boldsymbol{Q}}tr[\boldsymbol{P}\boldsymbol{\Lambda}\boldsymbol{Q}^T\boldsymbol{\Sigma}^T] \\ &= tr[\boldsymbol{\Lambda}\boldsymbol{\Lambda}+\boldsymbol{\Sigma}\boldsymbol{\Sigma}]-2\sum_{i}\sigma_{i}(\boldsymbol{\Sigma})\sigma_{i}(\boldsymbol{\Lambda})\quad(Lemma\quad\boxed{3}) \end{aligned}$
P和Q的最优解分别为矩阵Λ的SVD的列基和行基。由于Λ已经是对角矩阵，P和Q是置换矩阵，使得对角矩阵 $\boldsymbol{P}\boldsymbol{\Lambda}{\boldsymbol{Q}^T}$ 具有非升序的对角元素。
给定正交矩阵P和Q，求解
$\hat{\boldsymbol{\Lambda}}=\arg\min_{\boldsymbol{\Lambda}}\|\boldsymbol{P}\boldsymbol{\Lambda}\boldsymbol{Q}^T-\boldsymbol{\Sigma}\|_F^2+\|\boldsymbol{P}\boldsymbol{\Lambda}\boldsymbol{Q}^T\|_{\boldsymbol{w},*}.$
由于 $\boldsymbol{P\Lambda}\boldsymbol{Q}^{T}$ 是具有非升序元素的对角矩阵，我们有
$\hat{\boldsymbol{\Lambda}}=\arg\min_{\boldsymbol{\Lambda}}\sum_i\|(\boldsymbol{P}\boldsymbol{\Lambda}\boldsymbol{Q}^T)_{ii}-\boldsymbol{\Sigma}_{ii}\|_2^2+|w_i\cdot(\boldsymbol{P}\boldsymbol{\Lambda}\boldsymbol{Q}^T)_{ii}|_1.$
可以对对角矩阵 $\boldsymbol{P}\boldsymbol{\Lambda}{\boldsymbol{Q}^T}$ 的每个元素进行软阈值操作。因为P和Q是只改变对角元素位置的置换矩阵，所以有
$\hat{\boldsymbol{\Lambda}}=\boldsymbol{P}^T\mathcal{S}_{\boldsymbol{w}}(\boldsymbol{\Sigma})\boldsymbol{Q}.$
通过迭代上述两个步骤，(6)可以通过对对角元素排序和奇异值收缩来迭代求解：
$\begin{cases}(\boldsymbol{P}_{(k+1)}^T,\boldsymbol{\Phi},\boldsymbol{Q}_{(k+1)}^T)=SVD(\boldsymbol{\Lambda}_{(k)});\\\boldsymbol{\Lambda}_{(k+1)}=\boldsymbol{P}_{(k+1)}^T\boldsymbol{S}_{\boldsymbol{w}}(\boldsymbol{\Sigma})\boldsymbol{Q}_{(k+1)}.\end{cases}\quad(5)$
基于定理1的结论，可以得到 $\hat{\boldsymbol{X}}$ 的最终估计为
$\hat{X}=\boldsymbol{U}\hat{\boldsymbol{P}}^T\mathcal{S}_\mathbf{w}(\boldsymbol{\Sigma})\hat{\boldsymbol{Q}}V^T.$

非降序

最后，我们考虑另一种特殊但非常有用的情况，即权重 $w_{i,...,n}$ 是非降序排列的。基于任意顺序之中提出的迭代算法，我们有如下推论。

推论1 如果权重满足 $0\leq w_{1}\leq\ldots\leq w_{n},$ ，则任意顺序之中的迭代算法将有一个不动点 $\hat{X}=U\mathcal{S}_{\boldsymbol{w}}(\boldsymbol{\Sigma})V^{T}.$

证明:在(5)式中，通过将 $\Lambda_{(0)}$ 初始化为具有非升序对角元的对角矩阵，我们有
$\begin{cases}(\boldsymbol{P}_{(1)}=\boldsymbol{I},\boldsymbol{\Phi}=\boldsymbol{\Lambda}_{(0)},\boldsymbol{Q}_{(1)}=\boldsymbol{I})=SVD(\boldsymbol{\Lambda}_{(0)});\\\boldsymbol{\Lambda}_{(1)}=\boldsymbol{I}\boldsymbol{S}_{\boldsymbol{w}}(\boldsymbol{\Sigma})\boldsymbol{I}=\boldsymbol{S}_{\boldsymbol{w}}(\boldsymbol{\Sigma}).\end{cases}$
因此，令 $\forall0<i<j\leq n,$ ，有 $\Sigma_{ii}\geq\Sigma_{jj}$ 、 $w_{i}\leq w_{j}$ 。经过软阈值操作后， $\Lambda_{(1)}=S_{\mathbf{w}}(\boldsymbol{\Sigma})$ 仍然满足非升阶。因此在下一次迭代中，P和Q仍为单位矩阵，式( 4 )的优化达到一个固定点。基于定理1的结论，我们通过 $\hat{\boldsymbol{X}}=\boldsymbol{U}\mathcal{S}_{\boldsymbol{w}}(\boldsymbol{\Sigma})V^{T}$ 得到X的不动点估计.

推论1中的结论是非常重要和有用的.矩阵的奇异值总是按照非升序排列，较大的奇异值通常对应于数据矩阵中较重要成分的子空间。因此，我们最好对较大的奇异值进行较小的收缩，即在加权核范数中对较大的奇异值赋予较小的权重。在这种情况下，推论1保证了我们提出的迭代算法有一个不动点。此外，该不动点具有解析形式(即( $,\hat{X}=U\mathcal{S}_{\mathbf{w}}(\boldsymbol{\Sigma})V^{T}$ )。因此，在实际中我们不需要真正地迭代，而是直接在一个步骤中得到想要的解，这使得我们提出的方法非常有效。

WNNM用于图像去噪

图像去噪的目的是从含噪图像 $y = x + n$ 中恢复出原始图像x。其中n是均值为零，方差为 $\sigma_n^2$ 的加性高斯白噪声。对于图像y中的一个局部块 $y_j$ ，我们可以通过块匹配等方法在图像(在实际中,在足够大的局部窗口内)中搜索它的非局部相似块。通过将这些非局部相似块堆叠成一个矩阵，记为Yj，得到：
$\boldsymbol{Y}_j=\boldsymbol{X}_j+\boldsymbol{N}_j$
其中 $X_j$ 和 $N_j$ 分别是原始图像和噪声的块矩阵。

将提出的WNNM模型应用于 $Y_j$ 来估计 $X_j$ ，用于图像去噪。通过使用噪声方差 $\sigma_n^2$ 来归一化F范数数据保真项 $\|\boldsymbol{Y}_j-\boldsymbol{X}_j\|_F^2$ ，我们有如下能量函数：
$\hat{\boldsymbol{X}}_j=\arg\min_{\boldsymbol{X}_j}\frac{1}{\sigma_n^2}\|\boldsymbol{Y}_j-\boldsymbol{X}_j\|_F^2+\|\boldsymbol{X}_j\|_{\boldsymbol{W},*}.\quad(6)$
显然，现在的关键问题是权重向量w的确定。对于自然图像，我们有一个普遍的先验知识，即 $X_j$ 的较大奇异值比较小的奇异值更重要，因为它们代表了 $X_j$ 的主要成分的能量。在去噪应用中，奇异值越大，应收缩的越少。因此，一个自然的想法是，分配给 $X_j$ 的第i个奇异值 $\sigma_i(\boldsymbol{X}_j)$ 的权重应该与 $\sigma_i(\boldsymbol{X}_j)$ 成反比。令
$w_i=c\sqrt{n}\Big/(\sigma_i(\boldsymbol{X}_j)+\varepsilon),\quad(7)$
其中c > 0是常数，n是 $Y_j$ 中相似块的个数， $\varepsilon=10^{-16}$ 是为了避免除以零.

根据此权重可以用非降序的WNNM算法用于模型(7),然而，仍然存在一个问题，即奇异值 $\sigma_i(\boldsymbol{X}_j)$ 不可用。我们假设噪声能量均匀分布在由U和V的基对张成的每个子空间上。

则初始σ i ( Xj )可以估计为:
$\hat{\sigma}_i(\boldsymbol{X}_j)=\sqrt{\max(\sigma_i^2(\boldsymbol{Y}_j)-n\sigma_n^2,0)},$
其中 $\sigma_i(\boldsymbol{Y}_j)$ 是 $Y_j$ 的第i个奇异值.注意，由于 $\sigma_i(\boldsymbol{Y}_j)$ 总是按非升序排序，所以得到的权重 $w_{i=1,...,n}$ 是保证非降序的