III. 校准模型
确定串扰参数的一般方法涉及对多个像素的极化返回进行平均。假设散射是互易的,在线性基下校准的协方差矩阵的一般形式为:
[ Σ ] = [ Σ H H H H A ∗ A ∗ Σ H H V V A β β ′ B A β ′ β B Σ V V H H B ∗ B ∗ Σ V V V V ] ( 8 ) [\Sigma]=\left[\begin{array}{cccc} \Sigma_{\mathrm{HHHH}} & A^* & A^* & \Sigma_{\mathrm{HHVV}} \\ A & \beta & \beta^{\prime} & B \\ A & \beta^{\prime} & \beta & B \\ \Sigma_{\mathrm{VVHH}} & B^* & B^* & \Sigma_{\mathrm{VVVV}} \end{array}\right] (8) [Σ]= ΣHHHHAAΣVVHHA∗ββ′B∗A∗β′βB∗ΣHHVVBBΣVVVV (8)
其中 * 表示复共轭。 β \beta β 和 β ′ \beta^{\prime} β′ 是实数;其余为复数。由于互易性意味着两个交叉极化通道 HV 和 VH 是相同的,因此校准后的数据要求它们及其所有相关性实际上也是相同的。这种协方差矩阵的形式非常通用,允许非零螺旋度和方位角等。理想情况下, β \beta β 等于 β ′ \beta^{\prime} β′,但我们通过允许 β ≥ β ′ \beta \geq \beta^{\prime} β≥β′ 来考虑系统(极化)噪声的存在。关于散射对称性的更严格假设[3]对 A A A 和 B B B 的值提出了额外的要求。反射对称性意味着存在一个方位角(雷达视线周围的旋转),使得旋转后 A = B = 0 A=B=0 A=B=0。然而,显式地将 A = B = 0 A=B=0 A=B=0(方位角对称性)可能不恰当,因为平均而言,这要求反射对称性且平均方位角等于零。将 ℜ e ( A ) = ℜ e ( B ) \Re e(A)=\Re e(B) ℜe(A)=ℜe(B) 设置为零强制平均方位角为零。类似地,强制后向散射的零平均螺旋度需要 ℑ m ( A ) = ℑ m ( B ) \Im m(A)=\Im m(B) ℑm(A)=ℑm(B)。问题变成了以某种合理且实用的方式估计 A A A 和 B B B 的适当值,这与互易散射对称性一致。我们建议从观察到的协方差矩阵元素的平均值中获得 A A A 和 B B B 的估计值。在以下发展中,平均的精确方法(例如,平均窗口的大小和形状)并不关键,因此我们推迟其讨论。观察到的极化图像决定了 A A A 和 B B B 的估计值。给定 A A A 和 B B B,校准模型(8)提供了三个实数和四个复数方程来确定六个复数 u , v , w , z , α u, v, w, z, \alpha u,v,w,z,α,和 k k k,以及一个实数 η = β − β ′ \eta=\beta-\beta^{\prime} η=β−β′,即系统噪声。
方程(9)的第一行确定了 α \alpha α 和 η \eta η 的值:
Σ H V H V = Σ V H V H ( = β ) β ′ = Σ V H H V ℑ m ( Σ V H H V ) = 0 A = Σ H V H H A = Σ V H H H B = Σ H V V V B = Σ V H V V ( 9 ) \begin{aligned} & \Sigma_{\mathrm{HVHV}}=\Sigma_{\mathrm{VHVH}}(=\beta) \quad \beta^{\prime}=\Sigma_{\mathrm{VHHV}} \quad \Im m\left(\Sigma_{\mathrm{VHHV}}\right)=0 \\ & A=\Sigma_{\mathrm{HVHH}} \quad A=\Sigma_{\mathrm{VHHH}} \quad B=\Sigma_{\mathrm{HVVV}} \quad B=\Sigma_{\mathrm{VHVV}} \end{aligned}(9) ΣHVHV=ΣVHVH(=β)β′=ΣVHHVℑm(ΣVHHV)=0A=ΣHVHHA=ΣVHHHB=ΣHVVVB=ΣVHVV(9)
(9)的第二行中的四个剩余复数方程确定了复串扰系数 u , v , w u, v, w u,v,w,和 z z z。 k k k 的值仍然是不确定的。
暂时考虑(6)当串扰参数为零时。校准矩阵 [ M ] [M] [M] 简化为 [ G ] [G] [G],得到(10),其中 [ Σ ′ ] [\Sigma^{\prime}] [Σ′] 的撇号表示只有对角矩阵 [ G ] [G] [G](如页面底部方程所示),而不是完整的 [ M ] [M] [M],乘以了 [ C ] [C] [C]。假设没有串扰,将(9)的第一行明确重写为观察到的协方差 [ C ] [C] [C] 的形式,得到(11)。 α \alpha α 的幅度校正了 C H V H V C_{\mathrm{HVHV}} CHVHV 和 C V H V H C_{\mathrm{VHVH}} CVHVH 分量:
β ≅ Σ H V H V ′ = C H V H V ∣ α ∣ 2 β ≅ Σ V H V H ′ = C V H V H ∣ α ∣ − 2 β ′ ≅ Σ V H H V ′ = C V H H V α ∗ / α ( 11 ) \begin{aligned} \beta \cong \Sigma_{\mathrm{HVHV}}^{\prime} & =C_{\mathrm{HVHV}}|\alpha|^2 \\ \beta \cong \Sigma_{\mathrm{VHVH}}^{\prime} & =C_{\mathrm{VHVH}}|\alpha|^{-2} \\ \beta^{\prime} \cong \Sigma_{\mathrm{VHHV}}^{\prime} & =C_{\mathrm{VHHV}} \alpha^* / \alpha \end{aligned}(11) β≅ΣHVHV′β≅ΣVHVH′β′≅ΣVHHV′=CHVHV∣α∣2=CVHVH∣α∣−2=CVHHVα∗/α(11)
通过构造, C H V H V C_{\mathrm{HVHV}} CHVHV 和 C V H V H C_{\mathrm{VHVH}} CVHVH 是实数。 α \alpha α 的相位将 C V H H V C_{\mathrm{VHHV}} CVHHV 的相位归零,同时将 C H V V H = C V H H V ∗ C_{\mathrm{HVVH}}=C_{\mathrm{VHHV}}^* CHVVH=CVHHV∗ 的相位也归零。 β \beta β 和 β ′ \beta^{\prime} β′ 之间的差异定义了 η \eta η,即极化噪声。观察到的协方差元素 C H V H V , C H V V H , C V H H V C_{\mathrm{HVHV}}, C_{\mathrm{HVVH}}, C_{\mathrm{VHHV}} CHVHV,CHVVH,CVHHV,和 C V H V H C_{\mathrm{VHVH}} CVHVH 设置了交叉极化增益 α \alpha α 和系统噪声 η \eta η 的值,此时该项基本只受串扰影响
[ Σ ′ ] = [ G ] − 1 [ C ] [ G ] † − 1 = [ C H H H H / ∣ k ∣ 2 ∣ α ∣ 2 C H H H V α ∗ / k α C H H V H / k ∣ α ∣ 2 C H H V V k ∗ α ∗ / k α C H V H H α / k ∗ α ∗ C H V H V ∣ α ∣ 2 C H V V H α / α ∗ C H V V V k ∗ ∣ α ∣ 2 C V H H H / k ∗ ∣ α ∣ 2 C V H H V α ∗ / α C V H V H / ∣ α ∣ 2 C V H V V k ∗ α ∗ / α C V V H H k α / k ∗ α ∗ C V V H V k ∣ α ∣ 2 C V V V H k α / α ∗ C V V V V ∣ k ∣ 2 ∣ α ∣ 2 ] ( 10 ) \left[\Sigma^{\prime}\right]=[G]^{-1}[C][G]^{\dagger^{-1}}=\left[\begin{array}{cccc} C_{\mathrm{HHHH}} /|k|^2|\alpha|^2 & C_{\mathrm{HHHV}} \alpha^* / k \alpha & C_{\mathrm{HHVH}} / k|\alpha|^2 & C_{\mathrm{HHVV}} k^* \alpha^* / k \alpha \\ C_{\mathrm{HVHH}} \alpha / k^* \alpha^* & C_{\mathrm{HVHV}}|\alpha|^2 & C_{\mathrm{HVVH}} \alpha / \alpha^* & C_{\mathrm{HVVV}} k^*|\alpha|^2 \\ C_{\mathrm{VHHH}} / k^*|\alpha|^2 & C_{\mathrm{VHHV}} \alpha^* / \alpha & C_{\mathrm{VHVH}} /|\alpha|^2 & C_{\mathrm{VHVV}} k^* \alpha^* / \alpha \\ C_{\mathrm{VVHH}} k \alpha / k^* \alpha^* & C_{\mathrm{VVHV}} k|\alpha|^2 & C_{\mathrm{VVVH}} k \alpha / \alpha^* & C_{\mathrm{VVVV}}|k|^2|\alpha|^2 \end{array}\right](10) [Σ′]=[G]−1[C][G]†−1= CHHHH/∣k∣2∣α∣2CHVHHα/k∗α∗CVHHH/k∗∣α∣2CVVHHkα/k∗α∗CHHHVα∗/kαCHVHV∣α∣2CVHHVα∗/αCVVHVk∣α∣2CHHVH/k∣α∣2CHVVHα/α∗CVHVH/∣α∣2CVVVHkα/α∗CHHVVk∗α∗/kαCHVVVk∗∣α∣2CVHVVk∗α∗/αCVVVV∣k∣2∣α∣2 (10)
1、HVHV和VHVH的差异只有
α
\alpha
α,可以避免算出
α
\alpha
α和K组合的影响。前提是串扰要足够小。因为串扰会影响HVHV和VHVH,串扰大的话,解算出的是串扰+
α
\alpha
α的影响。
2、恢复
α
\alpha
α影响时,HVHH 会乘
α
/
α
∗
\alpha/\alpha^*
α/α∗,VHHH除以
1
/
∣
α
∣
2
1/|\alpha|^2
1/∣α∣2。
从平均协方差矩阵出发, A A A和 B B B的值是观测到的协方差矩阵元素(12)的加权平均值,或者等价地,是 [ Σ ′ ] \left[\Sigma^{\prime}\right] [Σ′]矩阵元素的平均值。 k k k的值不影响 α \alpha α
A = ( C H V H H α / α ∗ + C V H H H / ∣ α ∣ 2 ) / 2 k ∗ = ( Σ H V H H ′ + Σ V H H H ′ ) / 2 B = ( C H V V V ∣ α ∣ 2 + C V H V V α ∗ / α ) k ∗ / 2 = ( Σ H V V V ′ + Σ V H V V ′ ) / 2 ( 12 ) \begin{aligned} A & =\left(C_{\mathrm{HVHH}} \alpha / \alpha^*+C_{\mathrm{VHHH}} /|\alpha|^2\right) / 2 k^* \\ & =\left(\Sigma_{\mathrm{HVHH}}^{\prime}+\Sigma_{\mathrm{VHHH}}^{\prime}\right) / 2 \\ B & =\left(C_{\mathrm{HVVV}}|\alpha|^2+C_{\mathrm{VHVV}} \alpha^* / \alpha\right) k^* / 2 \\ & =\left(\Sigma_{\mathrm{HVVV}}^{\prime}+\Sigma_{\mathrm{VHVV}}^{\prime}\right) / 2 \end{aligned}(12) AB=(CHVHHα/α∗+CVHHH/∣α∣2)/2k∗=(ΣHVHH′+ΣVHHH′)/2=(CHVVV∣α∣2+CVHVVα∗/α)k∗/2=(ΣHVVV′+ΣVHVV′)/2(12)
k k k通过一个比例因子修改 A A A和 B B B,但不影响(12)中的平均值。事实上,由于 k k k不显式依赖于HV或VH的返回值,它通常与校准方程的其他部分解耦。给定 α , A \alpha, A α,A和 B B B,从(9)的第二行得到的四个方程 A = Σ H V H H , A = Σ V H H H , B = Σ H V V V A=\Sigma_{\mathrm{HVHH}}, A=\Sigma_{\mathrm{VHHH}}, B=\Sigma_{\mathrm{HVVV}} A=ΣHVHH,A=ΣVHHH,B=ΣHVVV和 B = Σ V H V V B=\Sigma_{\mathrm{VHVV}} B=ΣVHVV,决定了四个串扰参数。然而,从(4)中可以明显看出,串扰补偿会影响交叉极化增益,因此每当 u , v , w u, v, w u,v,w或 z z z的值发生变化时,都需要更新 α \alpha α的值,进而更新 A A A和 B B B的值。
在本节中,我们给出了目标协方差矩阵(8),它提供了所需的校准协方差矩阵的形式,并给出了一种确定与平均协方差矩阵一致的 A A A和 B B B值的方法。下一节将展示定义 [ M ] [M] [M]的参数值如何调整以达到这种形式。
IV. 数值方法
非线性方程(6)允许通过从多个像素的平均极化协方差矩阵中迭代求解校准参数[6],[7]。首先,我们假设 u , v , w , z u, v, w, z u,v,w,z为零,解方程(6)得到 α \alpha α的值。然后,通过求解一组复线性方程来更新 u , v , w , z u, v, w, z u,v,w,z的值。利用 u , v , w , z u, v, w, z u,v,w,z和 α \alpha α计算出近似的校准矩阵 [ M ′ ] \left[M^{\prime}\right] [M′],并将其应用于 [ C ] [C] [C],从而得到 [ Σ ] [\Sigma] [Σ]的近似值。之后,重新估计 α \alpha α的值,并重复迭代过程。通常, A , B , β A, B, \beta A,B,β和 β ′ \beta^{\prime} β′的估计与 k k k无关。因此, k k k的估计和校正通常作为最后一步进行。默认情况下,我们将 k k k设为1。然而,当 A A A和 B B B的值通过额外的散射对称性关系明确相关时(例如,强制零螺旋度使 ℑ m ( A ) = ℑ m ( B ) \Im m(A)=\Im m(B) ℑm(A)=ℑm(B)),则 k k k的值会影响 A A A和 B B B的估计。在这些情况下,我们会同时更新 k k k和 α \alpha α的值。但是,对于本文,我们仅施加散射互易性;因此,在所有其他校正应用完毕后,我们最后调整 k k k。
方程(6)的解意味着所有校准系数和校准后的协方差矩阵元素都是自洽确定的。校准过程迫使未校准的协方差矩阵匹配形式(8)。如果我们校准的协方差矩阵已经具有形式(8),则矩阵 [ M ] [M] [M]为单位矩阵;所有串扰参数为零; k k k和 α \alpha α都是实数且等于1。对已校准的协方差矩阵进行重新校准不会产生任何效果。
按照上述步骤,我们从比值 C V H V H / C H V H V C_{\mathrm{VHVH}} / C_{\mathrm{HVHV}} CVHVH/CHVHV和 C V H H V C_{\mathrm{VHHV}} CVHHV的相位推导出 α \alpha α的初始值:
α = ∣ C V H V H / C H V H V ∣ 1 / 4 exp ( i tan − 1 ( C V H H V ) / 2 ) ( 13 ) \alpha=\left|C_{\mathrm{VHVH}} / C_{\mathrm{HVHV}}\right|^{1 / 4} \exp \left(i \tan ^{-1}\left(C_{\mathrm{VHHV}}\right) / 2\right)(13) α=∣CVHVH/CHVHV∣1/4exp(itan−1(CVHHV)/2)(13)
将 α \alpha α校正应用于 [ C ] [C] [C](如(10)所示)定义了部分校准的矩阵 [ Σ ′ ] \left[\Sigma^{\prime}\right] [Σ′]。然而, [ Σ ′ ] \left[\Sigma^{\prime}\right] [Σ′]仍然需要串扰补偿。现在执行平均操作(12)以从 [ Σ ′ ] \left[\Sigma^{\prime}\right] [Σ′]中估计 A A A和 B B B。串扰方程的推导相对直接,但可能有些繁琐。 [ Σ ′ ] \left[\Sigma^{\prime}\right] [Σ′]矩阵被串扰矩阵的逆矩阵及其厄米共轭矩阵前后相乘:
[
Σ
′
′
]
=
[
1
v
w
v
w
z
1
w
z
w
u
u
v
1
v
u
z
u
z
1
]
−
1
[
Σ
′
]
[
1
v
w
v
w
z
1
w
z
w
u
u
v
1
v
u
z
u
z
1
]
†
−
1
(
14
)
\left[\Sigma^{\prime \prime}\right]=\left[\begin{array}{cccc} 1 & v & w & v w \\ z & 1 & w z & w \\ u & u v & 1 & v \\ u z & u & z & 1 \end{array}\right]^{-1}\left[\Sigma^{\prime}\right]\left[\begin{array}{cccc} 1 & v & w & v w \\ z & 1 & w z & w \\ u & u v & 1 & v \\ u z & u & z & 1 \end{array}\right]^{\dagger^{-1}}(14)
[Σ′′]=
1zuuzv1uvuwwz1zvwwv1
−1[Σ′]
1zuuzv1uvuwwz1zvwwv1
†−1(14)
对α定标后,再对串扰矩阵如此顺序定标,经验证确实约等于原始矩阵,可用matlab代码证明。所以等式成立
这定义了矩阵
[
Σ
′
′
]
\left[\Sigma^{\prime \prime}\right]
[Σ′′]。我们明确地推导出
[
Σ
′
′
]
\left[\Sigma^{\prime \prime}\right]
[Σ′′]中四个元素应等于
A
A
A或
B
B
B的方程,这些方程以
u
,
v
,
w
,
z
u, v, w, z
u,v,w,z和
[
Σ
′
]
\left[\Sigma^{\prime}\right]
[Σ′]的元素为自变量。在关于
u
,
v
,
w
,
z
u, v, w, z
u,v,w,z的线性化之后,关于校准参数的四个复约束为:
A = Σ H V H H ′ ′ ≅ Σ H V H H ′ − w Σ V V H H ′ − z Σ H H H H ′ − v ∗ Σ H V H V ′ − w ∗ Σ H V V H ′ + ⋯ A = Σ V H H H ′ ′ ≅ Σ V H H H ′ − u Σ H H H H ′ − v Σ V V H H ′ − v ∗ Σ V H H V ′ − w ∗ Σ V H V H ′ + ⋯ B = Σ H V V V ′ ′ ≅ Σ H V V V ′ − w Σ V V V V ′ − z Σ H H V V ′ − u ∗ Σ H V H V ′ − z ∗ Σ H V V H ′ + ⋯ B = Σ V H V V ′ ′ ≅ Σ V H V V ′ − u Σ H H V V ′ − v Σ V V V V ′ − u ∗ Σ V H H V ′ − z ∗ Σ V H V H ′ + ⋯ ( 15 ) \begin{aligned} A= & \Sigma_{\mathrm{HVHH}}^{\prime \prime} \cong \Sigma_{\mathrm{HVHH}}^{\prime}-w \Sigma_{\mathrm{VVHH}}^{\prime}-z \Sigma_{\mathrm{HHHH}}^{\prime} \\ & -v^* \Sigma_{\mathrm{HVHV}}^{\prime}-w^* \Sigma_{\mathrm{HVVH}}^{\prime}+\cdots \\ A= & \Sigma_{\mathrm{VHHH}}^{\prime \prime} \cong \Sigma_{\mathrm{VHHH}}^{\prime}-u \Sigma_{\mathrm{HHHH}}^{\prime}-v \Sigma_{\mathrm{VVHH}}^{\prime} \\ & -v^* \Sigma_{\mathrm{VHHV}}^{\prime}-w^* \Sigma_{\mathrm{VHVH}}^{\prime}+\cdots \\ B= & \Sigma_{\mathrm{HVVV}}^{\prime \prime} \cong \Sigma_{\mathrm{HVVV}}^{\prime}-w \Sigma_{\mathrm{VVVV}}^{\prime}-z \Sigma_{\mathrm{HHVV}}^{\prime} \\ & -u^* \Sigma_{\mathrm{HVHV}}^{\prime}-z^* \Sigma_{\mathrm{HVVH}}^{\prime}+\cdots \\ B= & \Sigma_{\mathrm{VHVV}}^{\prime \prime} \cong \Sigma_{\mathrm{VHVV}}^{\prime}-u \Sigma_{\mathrm{HHVV}}^{\prime}-v \Sigma_{\mathrm{VVVV}}^{\prime} \\ & -u^* \Sigma_{\mathrm{VHHV}}^{\prime}-z^* \Sigma_{\mathrm{VHVH}}^{\prime}+\cdots \end{aligned} (15) A=A=B=B=ΣHVHH′′≅ΣHVHH′−wΣVVHH′−zΣHHHH′−v∗ΣHVHV′−w∗ΣHVVH′+⋯ΣVHHH′′≅ΣVHHH′−uΣHHHH′−vΣVVHH′−v∗ΣVHHV′−w∗ΣVHVH′+⋯ΣHVVV′′≅ΣHVVV′−wΣVVVV′−zΣHHVV′−u∗ΣHVHV′−z∗ΣHVVH′+⋯ΣVHVV′′≅ΣVHVV′−uΣHHVV′−vΣVVVV′−u∗ΣVHHV′−z∗ΣVHVH′+⋯(15)
在(15)中,我们舍去 u , v , w u, v, w u,v,w和 z z z中的所有二阶及更高阶项。按(14)中的要求求解串扰矩阵的逆矩阵是直接的,如下所示:
[ 1 v w v w z 1 w z w u u v 1 v u z u z 1 ] − 1 = [ 1 − v − w v w − z 1 w z − w − u u v 1 − v u z − u − z 1 ] × ( ( 1 − v z ) ( 1 − u w ) ) − 1 ( 16 ) \begin{aligned} \left[\begin{array}{cccc} 1 & v & w & v w \\ z & 1 & w z & w \\ u & u v & 1 & v \\ u z & u & z & 1 \end{array}\right]^{-1}= & \left[\begin{array}{cccc} 1 & -v & -w & v w \\ -z & 1 & w z & -w \\ -u & u v & 1 & -v \\ u z & -u & -z & 1 \end{array}\right] \\ & \times((1-v z)(1-u w))^{-1} \end{aligned}(16) 1zuuzv1uvuwwz1zvwwv1 −1= 1−z−uuz−v1uv−u−wwz1−zvw−w−v1 ×((1−vz)(1−uw))−1(16)
(16)式分母中的标量因子是二次的,不影响(15)中的线性化结果。
将(15)式重写为矩阵形式,并分别考虑 u , v , w u, v, w u,v,w和 z z z的实部和虚部,可以求解一组八个耦合的实数方程:
[ ℜ e [ X ] ℑ m [ X ] ] = [ ℜ e [ ζ + τ ] − ℑ m [ ζ − τ ] ℑ m [ ζ + τ ] ℜ e [ ζ − τ ] ] [ ℜ e [ δ ] ℑ m [ δ ] ] ( 17 ) \left[\begin{array}{c} \Re e[X] \\ \Im m[X] \end{array}\right]=\left[\begin{array}{cc} \Re e[\zeta+\tau] & -\Im m[\zeta-\tau] \\ \Im m[\zeta+\tau] & \Re e[\zeta-\tau] \end{array}\right]\left[\begin{array}{c} \Re e[\delta] \\ \Im m[\delta] \end{array}\right](17) [ℜe[X]ℑm[X]]=[ℜe[ζ+τ]ℑm[ζ+τ]−ℑm[ζ−τ]ℜe[ζ−τ]][ℜe[δ]ℑm[δ]](17)
其中 [ δ ] [\delta] [δ]定义了当前迭代中 u , v , w u, v, w u,v,w和 z z z的增量变化。关系式
[
X
]
=
[
Σ
H
V
H
H
′
−
A
Σ
V
H
H
H
′
−
A
Σ
H
V
V
V
′
−
B
Σ
V
H
V
V
′
−
B
]
[X]=\left[\begin{array}{c} \Sigma_{\mathrm{HVHH}}^{\prime}-A \\ \Sigma_{\mathrm{VHHH}}^{\prime}-A \\ \Sigma_{\mathrm{HVVV}}^{\prime}-B \\ \Sigma_{\mathrm{VHVV}}^{\prime}-B \end{array}\right]
[X]=
ΣHVHH′−AΣVHHH′−AΣHVVV′−BΣVHVV′−B
[
s
]
=
[
0
0
Σ
V
V
H
H
′
Σ
H
H
H
H
′
Σ
H
H
H
H
′
Σ
V
V
H
H
′
0
0
0
0
Σ
V
V
V
V
′
Σ
H
H
V
V
′
Σ
H
H
V
V
′
Σ
V
V
V
V
′
0
0
]
[
δ
]
=
[
δ
u
δ
v
δ
w
δ
z
]
[
τ
]
=
[
0
Σ
H
V
H
V
′
Σ
H
V
V
H
′
0
0
Σ
V
H
H
V
′
Σ
V
H
V
H
′
0
Σ
H
V
H
V
′
0
0
Σ
H
V
V
H
′
Σ
V
H
H
V
′
0
0
Σ
V
H
V
H
′
]
(
18
)
\begin{aligned} & [s]=\left[\begin{array}{cccc} 0 & 0 & \Sigma_{\mathrm{VVHH}}^{\prime} & \Sigma_{\mathrm{HHHH}}^{\prime} \\ \Sigma_{\mathrm{HHHH}}^{\prime} & \Sigma_{\mathrm{VVHH}}^{\prime} & 0 & 0 \\ 0 & 0 & \Sigma_{\mathrm{VVVV}}^{\prime} & \Sigma_{\mathrm{HHVV}}^{\prime} \\ \Sigma_{\mathrm{HHVV}}^{\prime} & \Sigma_{\mathrm{VVVV}}^{\prime} & 0 & 0 \end{array}\right] \\ & [\delta]=\left[\begin{array}{l} \delta_u \\ \delta_v \\ \delta_w \\ \delta_z \end{array}\right] \\ & [\tau]=\left[\begin{array}{cccc} 0 & \Sigma_{\mathrm{HVHV}}^{\prime} & \Sigma_{\mathrm{HVVH}}^{\prime} & 0 \\ 0 & \Sigma_{\mathrm{VHHV}}^{\prime} & \Sigma_{\mathrm{VHVH}}^{\prime} & 0 \\ \Sigma_{\mathrm{HVHV}}^{\prime} & 0 & 0 & \Sigma_{\mathrm{HVVH}}^{\prime} \\ \Sigma_{\mathrm{VHHV}}^{\prime} & 0 & 0 & \Sigma_{\mathrm{VHVH}}^{\prime} \end{array}\right] \end{aligned}(18)
[s]=
0ΣHHHH′0ΣHHVV′0ΣVVHH′0ΣVVVV′ΣVVHH′0ΣVVVV′0ΣHHHH′0ΣHHVV′0
[δ]=
δuδvδwδz
[τ]=
00ΣHVHV′ΣVHHV′ΣHVHV′ΣVHHV′00ΣHVVH′ΣVHVH′0000ΣHVVH′ΣVHVH′
(18)
定义了(17)中剩余的变量,这些变量与 [ Σ ′ ] \left[\Sigma^{\prime}\right] [Σ′]的元素相关,而串扰参数的更新方程为
[ u 1 v 1 w 1 z 1 ] = [ u 0 v 0 w 0 z 0 ] + [ δ u δ v δ w δ z ] ( 19 ) \left[\begin{array}{c} u_1 \\ v_1 \\ w_1 \\ z_1 \end{array}\right]=\left[\begin{array}{c} u_0 \\ v_0 \\ w_0 \\ z_0 \end{array}\right]+\left[\begin{array}{c} \delta_u \\ \delta_v \\ \delta_w \\ \delta_z \end{array}\right](19) u1v1w1z1 = u0v0w0z0 + δuδvδwδz (19)
其中(18)和(19)中的所有变量都是复数。将串扰校正应用于 [ Σ ′ ] \left[\Sigma^{\prime}\right] [Σ′]定义了 [ Σ ′ ′ ] \left[\Sigma^{\prime \prime}\right] [Σ′′],但由于与信道增益的耦合,现在需要更新 α \alpha α的值。 [ Σ ′ ′ ] \left[\Sigma^{\prime \prime}\right] [Σ′′]的元素决定了 α \alpha α的校正,如(13)所示,但其中 [ C ] [C] [C]被 [ Σ ′ ′ ] \left[\Sigma^{\prime \prime}\right] [Σ′′]替换。
α ′ ′ = ∣ Σ V H V H ′ ′ / Σ H V H V ′ ′ ∣ 1 / 4 exp ( i tan − 1 ( Σ V H H V ′ ′ ) / 2 ) ( 20 ) \alpha^{\prime \prime}=\left|\Sigma_{\mathrm{VHVH}}^{\prime \prime} / \Sigma_{\mathrm{HVHV}}^{\prime \prime}\right|^{1 / 4} \exp \left(i \tan ^{-1}\left(\Sigma_{\mathrm{VHHV}}^{\prime \prime}\right) / 2\right)(20) α′′=∣ΣVHVH′′/ΣHVHV′′∣1/4exp(itan−1(ΣVHHV′′)/2)(20)
在串扰校正之前和之后,分别应用了两次增益校正:初始的 α \alpha α来自(13)和 [ C ] [C] [C],以及它的校正 α ′ ′ \alpha^{\prime \prime} α′′来自(20)和 [ Σ ′ ′ ] \left[\Sigma^{\prime \prime}\right] [Σ′′]。(21)中说明了这一点。将 α ′ ′ \alpha^{\prime \prime} α′′校正与串扰矩阵交换意味着对串扰值进行重新缩放。参数 v v v和 z z z简单地通过 α ′ ′ 2 \alpha^{\prime \prime 2} α′′2进行重新缩放:
[ M ] ≅ [ α α − 1 α α − 1 ] [ 1 v w v w z 1 w z w u u v 1 v u z u z 1 ] × [ α ′ ′ α ′ ′ − 1 α ′ ′ α ′ ′ − 1 ] = [ ( α α ′ ′ ) ( α α ′ ′ ) − 1 ( α α ′ ′ ) ( α α ′ ′ ) − 1 ] × [ 1 v / α ′ ′ 2 w v w / α ′ 2 z α ′ ′ 2 1 w z α ′ ′ 2 w u u v / α ′ ′ 2 1 v / α ′ ′ 2 u z α ′ ′ 2 u z α ′ ′ 2 1 ] ( 21 ) \begin{aligned} & {[M] \cong\left[\begin{array}{llll} \alpha & & & \\ & \alpha^{-1} & & \\ & & \alpha & \\ & & & \alpha^{-1} \end{array}\right]\left[\begin{array}{cccc} 1 & v & w & v w \\ z & 1 & w z & w \\ u & u v & 1 & v \\ u z & u & z & 1 \end{array}\right]} \\ & \times\left[\begin{array}{llll} \alpha^{\prime \prime} & & & \\ & \alpha^{\prime \prime}-1 & & \\ & & \alpha^{\prime \prime} & \\ & & & \alpha^{\prime \prime-1} \end{array}\right] \\ & =\left[\begin{array}{llll} \left(\alpha \alpha^{\prime \prime}\right) & & & \\ & \left(\alpha \alpha^{\prime \prime}\right)^{-1} & & \\ & & \left(\alpha \alpha^{\prime \prime}\right) & \\ & & & \left(\alpha \alpha^{\prime \prime}\right)^{-1} \end{array}\right] \\ & \times\left[\begin{array}{cccc} 1 & v / \alpha^{\prime \prime 2} & w & v w / \alpha^{\prime 2} \\ z \alpha^{\prime \prime 2} & 1 & w z \alpha^{\prime \prime 2} & w \\ u & u v / \alpha^{\prime \prime 2} & 1 & v / \alpha^{\prime \prime 2} \\ u z \alpha^{\prime \prime 2} & u & z \alpha^{\prime \prime 2} & 1 \end{array}\right] \end{aligned}(21) [M]≅ αα−1αα−1 1zuuzv1uvuwwz1zvwwv1 × α′′α′′−1α′′α′′−1 = (αα′′)(αα′′)−1(αα′′)(αα′′)−1 × 1zα′′2uuzα′′2v/α′′21uv/α′′2uwwzα′′21zα′′2vw/α′2wv/α′′21 (21)
这样做不会改变串扰矩阵的形式。尽管这里我们设置
k
=
1
k=1
k=1,但串扰矩阵的特殊形式允许对所有
k
k
k和
α
\alpha
α值进行简单的重新缩放和交换。这种重新缩放虽然微妙,但对于迭代解的快速收敛至关重要。
一般的迭代方案如下:
-
从 [ C ] [C] [C](方程13)计算初始的 α \alpha α校正量,串扰校正量最初为零。
-
将总的 α \alpha α校正量(方程10)应用于观测到的协方差 [ C ] [C] [C],生成 [ Σ ′ ] \left[\Sigma^{\prime}\right] [Σ′]。
-
从 [ Σ ′ ] \left[\Sigma^{\prime}\right] [Σ′](方程12)估计 A A A和 B B B的值。
-
计算(方程17-19)并应用(方程14)来更新串扰参数,生成 [ Σ ′ ′ ] \left[\Sigma^{\prime \prime}\right] [Σ′′]。
-
从 [ Σ ′ ′ ] \left[\Sigma^{\prime \prime}\right] [Σ′′]计算 α ′ ′ \alpha^{\prime \prime} α′′的更新量(方程20),并校正 α \alpha α值, α new = α old ⋅ α ′ ′ \alpha_{\text {new }}=\alpha_{\text {old }} \cdot \alpha^{\prime \prime} αnew =αold ⋅α′′。
-
通过 α ′ ′ \alpha^{\prime \prime} α′′的更新量重新缩放串扰参数(方程21),并返回第2步。
在每个步骤中,我们都注意到相关的方程。这种迭代会迅速收敛到解;通常,几个循环就能确定解。 A A A和 B B B都迅速收敛到固定值。在估计 A A A和 B B B之前,必须先对交叉极化通道增益进行补偿,即第2步在第3步之前进行,否则未校正的交叉极化不平衡会扭曲平均值。
虽然这种校准方法的推导有些繁琐,但实际的实现却非常直接和简单。一旦确定了最终的校准参数,就构建并缩放校准矩阵 [ M ] [M] [M],使其行列式等于1。这可以防止因串扰校正而无意中应用整体辐射校正,例如(方程16)中的复标量因子。
参数 η \eta η考虑了系统的(极化)噪声。 β \beta β和 β ′ \beta^{\prime} β′之间的差异决定了 η \eta η的值。我们在校准算法中从未显式使用 η \eta η的值,因此我们等待迭代收敛后再计算其值。 η / β \eta / \beta η/β是数据质量的一个定性指标。随着噪声水平 η \eta η变得与任何对角协方差元素(即 β \beta β、 Σ H H H H \Sigma_{\mathrm{HHHH}} ΣHHHH或 Σ V V V V \Sigma_{\mathrm{VVVV}} ΣVVVV)相当,极化信息的可靠性就会受到质疑。通常,交叉极化回波比同极化回波弱,因此交叉极化回波对系统噪声更敏感。在极端情况下,当 η / β > 1 \eta / \beta>1 η/β>1时,校准程序会产生一个不可能的协方差矩阵,即不是正定的矩阵。这表明要么假定的模型(方程1)不适用,校准需要不同的方法,要么数据太嘈杂,包含的极化信息太少,无法准确校准。因此,无论数值解的准确性如何, η \eta η都允许直接评估校准的合理性。
校准矩阵 [ M ] [M] [M]的参数化导致了一组非线性方程(6)。一般来说,非线性方程的迭代解既不能保证解的唯一性,也不能保证解的存在性。在实践中,只要 ∣ u ∣ |u| ∣u∣、 ∣ v ∣ |v| ∣v∣、 ∣ w ∣ |w| ∣w∣和 ∣ z ∣ |z| ∣z∣都小于1,则关于串扰参数的线性化(方程15)就是可接受的。在这种情况下,被省略的高阶项成为线性解上的小扰动,完整的解通过迭代得出。只要串扰参数的幅度小于1,本节中概述的迭代解方案就足以解决这些非线性方程。
V. 共极化通道不平衡
参数 k k k和 α \alpha α决定了极化通道之间的相对增益和相位延迟。交叉极化增益 α \alpha α直接影响 C H V H V C_{\mathrm{HVHV}} CHVHV、 C V H V H C_{\mathrm{VHVH}} CVHVH、 C V H H V C_{\mathrm{VHHV}} CVHHV和 C H V V H C_{\mathrm{HVVH}} CHVVH这四个协方差元素,而 α \alpha α的估计过程相对直接。然而,参数 k k k更为棘手。仅仅通过计算自由参数的数量和由(8)式隐含的方程数量,就可以看出方程组是欠定的。没有额外信息, k k k的值是无法确定的。 k k k的直接影响体现在同极化回波及其相关性上。传统上,通过场景中的三面角反射器可以固定 k k k的相位和幅度[9]、[10]、[14]、[17]-[19]。或者,也可以采用场景中假定散射机制的理论或经验模型来设置 S H H / S V V S_{\mathrm{HH}} / S_{\mathrm{VV}} SHH/SVV的比率。施加另一种改变目标协方差矩阵(8)形式的散射对称性,也可以确定 k k k。还可以设想出其他或多或少临时性的方案来设置 k k k。在任何情况下,都需要额外信息或对场景中散射体的假设来确定 k k k。许多校准方法依赖于校准目标来提供已知的原位散射机制[8]-[10]、[13]-[21]。这些方法可以确定所有必要的校准参数。在这里,我们的目标仅仅是首先利用极化图像和散射互易性来评估和校正极化校准,然后以合理的方式补偿相对同极化增益。
VI. 模拟数据和无回波室结果
在欧洲微波特征实验室(EMSL)[22]、[23]的模拟数据和无回波室数据上测试校准算法产生了令人鼓舞的结果。我们从简单的散射体(三面角反射器、二面角反射器等)构建了模拟协方差矩阵,然后应用了多种串扰、通道不平衡、方向角和螺旋度旋转。(由于
k
k
k的值不能通过互易性约束来确定,我们将
k
k
k设置为1。)对结果协方差矩阵进行校准,为算法的一阶测试提供了依据。校准应补偿串扰和通道不平衡,但应保留方向角和螺旋度不变。事实确实如此。
图1. 黑线显示了所提出校准方法的结果。青色和品红色线条分别表示
[
τ
]
=
0
[\tau]=0
[τ]=0和线性近似。校准前后的方向角应相同。红线显示了常用校准技术的结果(
A
=
B
=
0
A=B=0
A=B=0,
[
τ
]
=
0
[\tau]=0
[τ]=0且仅一次迭代)。强制
A
=
B
=
0
A=B=0
A=B=0会使方向角低于正确值,从而产生S形曲线。此次计算采用的协方差矩阵源自EMSL粗糙高斯表面极化数据[22]、[23],这些数据是对所有观测方向以及以4 GHz(即C波段)为中心的频率范围内的数据进行平均得到的。
图2. 黑线再次显示了所提出校准方法的结果。青色和品红色线条分别表示
[
τ
]
=
0
[\tau]=0
[τ]=0和线性近似。在这里,线性近似与完整校准存在显著差异。在
−
1
0
∘
-10^{\circ}
−10∘附近的尖峰是由于在第一次(也是唯一一次)迭代中解决了一个几乎奇异的方程组(17)而产生的。随后的迭代将使品红色线条向黑色线条移动。红线显示了强制
A
=
B
=
0
A=B=0
A=B=0后得到的可疑结果。方向角(红线)与已知结果相差高达
±
2
5
∘
\pm 25^{\circ}
±25∘,均方根误差为
1
6
∘
16^{\circ}
16∘,而所提出校准方法的结果(黑线)与已知结果的偏差小于
±
3
∘
\pm 3^{\circ}
±3∘,均方根误差为
1.
6
∘
1.6^{\circ}
1.6∘。此次计算采用的协方差矩阵源自EMSL平滑高斯表面极化数据[22]、[23],这些数据是对所有观测方向以及以1.5 GHz(即L波段)为中心的频率范围内的数据进行平均得到的。
我们使用EMSL无回波室数据为“平滑”、“混合”和“粗糙”表面在大约对应于X、C和L波段的频率下构建了更真实的协方差矩阵。在校准这九个协方差矩阵之前和之后,计算出的方向角总是同意在
±
1
∘
\pm 1^{\circ}
±1∘以内。与前面提到的简单模拟相比,EMSL数据对应的是更复杂、更现实的表面散射。我们再次进行了方向角测试。在将EMSL协方差矩阵旋转一个已知的方向角后,我们对其进行了校准,并重新计算了方向角。重新计算的方向角与原始角度在
±
4
5
∘
\pm 45^{\circ}
±45∘的整个方向角范围内匹配,九个协方差矩阵的平均RMS误差小于
1
∘
1^{\circ}
1∘。与模拟数据集不同,EMSL协方差是实际测量的平均值,因此包含一定程度的噪声。这可能是校准前后计算出的方向角之间存在差异的可能原因。尽管如此,这些差异仍然很小。我们对几个先前校准过的EMSL协方差矩阵进行了重新校准,结果符合预期,即没有变化。
这些测试支持我们的通用校准程序,并表明至少对于方向角而言,校准不会使极化信息产生偏差。图1和图2展示了几种不同校准技术之间的比较。公式(18)中的
[
τ
]
[\tau]
[τ]矩阵元素通常小于
[
ζ
]
[\zeta]
[ζ]矩阵元素,因此,在一种比较中,我们将
[
τ
]
[\tau]
[τ]设置为0,但对我们迭代解法的其他部分不做任何更改。或者,我们保留了完整的校准方程组,但仅对它们进行了一次迭代。这种线性近似提供了对初始收敛速率的简单测试。通常,这两种近似校准的性能与完全迭代解法的性能相当。唯一的例外是,当初始串扰参数估计值过大时,因为集合(17)几乎是奇异的。线性近似无法恢复并破坏了方向角,如图2中紫色曲线在
−
1
0
∘
-10^{\circ}
−10∘和
+
8
∘
+8^{\circ}
+8∘附近所示。一种常用的标准校准方法是通过设置
A
=
B
=
0
,
[
τ
]
=
0
A=B=0,[\tau]=0
A=B=0,[τ]=0,然后进行一次迭代来再现的。
A
=
B
=
0
A=B=0
A=B=0约束迫使散射具有对称性,即方位角对称性,但旋转协方差矩阵并不遵守这一规律。通过仅进行一次迭代,螺旋度和方向角并未完全归零,如
A
=
B
=
0
A=B=0
A=B=0所暗示的。然而,我们之前的线性近似表明,经过一次迭代后,螺旋度或方向角可能接近零,如图2所示。当强制协方差矩阵与不适当的对称性(即
A
=
B
=
0
A=B=0
A=B=0)匹配时,不应期望得到好的结果。但是,如图2所示,校准迅速崩溃的情况令人惊讶。虽然没有任何校准方法可以保证在所有可能的情况下都能保持方向角(极化信息),但我们发现,在所有测试的情况下,我们对完整的非线性校准方程进行迭代求解的方法在整个施加的方向角范围内都表现得相当好。
VII. 图像校准方法
极化SAR图像的校准需要构建平均窗口。这些窗口应反映极化校准在图像中的预期变化。通常,校准是距离依赖的。天线增益模式随俯仰角变化而变化。 H H H和 V V V天线的相对位移会产生随距离变化的相位。这些距离依赖性表明,需要对每条恒距离线进行独立校准。我们首先在恒距离线上沿方位角进行平均。这些平均协方差矩阵确定了每条距离上的校准参数和校准矩阵 [ M ] [M] [M]。然后,使用 [ M ] [M] [M]对给定恒距离线上的每个像素进行校准。
在方位角方向上,可能存在未补偿的放大器增益和/或相位漂移。HH-VV相关系数相位是有时会显示方位角漂移的一个量。沿恒方位角线对协方差进行平均可以识别这些漂移。将校准应用于该恒方位角线上的每个像素可以校正漂移。由于这种第二次校准来自不同的平均窗口集合,因此会产生非平凡的校正结果。
在协方差矩阵平均中隐含的假设是,构成平均值的所有像素的校准参数都是相同的。因此,我们简单的恒距离平均值既不会检测到也不会消除方位角漂移;同样,恒方位角平均值也不会消除距离依赖性。因此,为了完全校准图像,可能需要采用不同平均方法的多次迭代。然而,如果在此过程的任何步骤中都不需要进行校正,我们的校准矩阵 [ M ] [M] [M]自然会简化为单位矩阵,并且不会产生任何影响。更具创新性的平均方案可能会更快地产生“更好”的校准图像。例如,定期对矩形区域进行平均,然后插值得到的校准参数,是一种在一次迭代中平滑校准整个图像的简单方法。然而,我们的直接目标是突出通用校准算法的能力,而不涉及图像特定的细化。在这里,我们将平均限制在恒距离线或恒方位角线上。
关于协方差矩阵平均的一个注意事项:虽然协方差矩阵平均不需要同质区域,但必须确保饱和像素不会影响平均值。这是所有采用平均协方差矩阵的校准技术的共同关注点。跨度(总功率)决定了哪些像素被包括在平均值中。理由是只有最亮的像素才会使接收器饱和,扭曲极化信息,从而不现实地扭曲协方差平均值。对于PiSAR示例,我们任意排除了约7%的最亮像素进行平均;结果对这个截止值不敏感。返回非常低总功率的像素也可能具有较差的极化信息,但只要平均值中的一些像素具有显著功率和明确定义的极化内容,它们就不会影响平均值。
VIII. 极化图像
我们以2000年10月在日本鸟取附近拍摄的一幅早期L波段PiSAR极化图像为例,来说明后验校准方法。在远场区域有一个大面积的光滑水面,而在近场区域则是一个山区。场景中间布置了一系列定向二面角和三面角反射器。我们利用这些目标作为地面实况来测试我们的校准程序。图3显示了我们在线性基下对PiSAR极化图像的校准。这张单幅图像方便地突出了我们校准技术的几个特点:图4绘制了导出的校准参数 α \alpha α的距离依赖性。这一距离依赖的校准步骤校正了极化通道之间未补偿的增益。串扰参数 u , v , w u, v, w u,v,w和 z z z也显示出一定的距离依赖性;典型值在0.05到0.20之间。图5说明了 z z z参数的距离依赖性;其他参数类似。
方位角依赖性要小得多。 Σ HHVV ′ ′ \Sigma_{\text {HHVV }}^{\prime \prime} ΣHHVV ′′相位的值在图像上从左到右缓慢漂移。我们调整 k k k的值以校正方位角相位漂移。这是利用额外信息以获得更好校准的一个例子。我们隐含地假设 Σ HHVV ′ ′ \Sigma_{\text {HHVV }}^{\prime \prime} ΣHHVV ′′的相位应作为方位角位置的函数而保持恒定,然后通过调整 k k k来在平均意义上实现这一结果。
图6显示了校准图像中的反射器阵列。围绕每个反射器的框的颜色表示给定反射器的理论散射机制。在Pauli基下的图像与地面实况吻合良好,并明确显示了HH-VV相位信息。每个反射器的颜色都与其周围框的颜色非常接近,这表明这是一幅经过良好校准的极化图像。对未校准的 ∣ H H ∣ 2 , ∣ V V ∣ 2 , ∣ H V ∣ 2 |\mathrm{HH}|^2,|\mathrm{VV}|^2,|\mathrm{HV}|^2 ∣HH∣2,∣VV∣2,∣HV∣2和 ∣ V H ∣ 2 |\mathrm{VH}|^2 ∣VH∣2在校准阵列上进行平均,得到的比率为 ∣ H H ∣ 2 / ∣ V V ∣ 2 ≅ 3.1 |\mathrm{HH}|^2 /|\mathrm{VV}|^2 \cong 3.1 ∣HH∣2/∣VV∣2≅3.1和 ∣ V H ∣ 2 / ∣ H V ∣ 2 ≅ 2.7 |\mathrm{VH}|^2 /|\mathrm{HV}|^2 \cong 2.7 ∣VH∣2/∣HV∣2≅2.7,这与图4中显示的 α \alpha α的幅度一致。从理论上讲,对于这些校准目标,比率应该为1。雷达目标回波(未校准、校准和理论回波)之间的比较为所提出的校准技术提供了定性和定量的支持。