环境数据高级映射与贝叶斯最大熵方法解析
1. 度量对依赖模型的影响
确定时空距离的度量会影响依赖模型的可容许性。一种度量下可容许的模型,在另一种度量下可能不可容许。一般来说,能与欧几里得或非欧几里得度量相关联的一类函数如下:
[c_{X,h} = e^{-N_P(h)}]
其中,(N_P(h) = \sum_{i = 1}^{n} |h_i|^P) 且 (0 < P \leq 2)。例如:
- 协方差 (c_{X,h} = e^{-|h|^2}) 仅适用于欧几里得度量,不适用于绝对度量。
- 协方差 (c_{X,h} = e^{-N_1(h)}) 适用于非欧几里得绝对度量。
这种分析还可扩展到更一般形式的度量 (|h| = (\sum_{i = 1}^{n} \omega_i |h_i|^P)^{\frac{1}{P}}),其中 (1 \leq P < 2),(\omega_i (i = 1, \cdots, n)) 是确定 (h_i) 方向“显著性”的权重。
2. 分形时空随机场(S/TRF)
分形范围内的协方差模型为:
[c_{X;p,c_p} \propto r^{\Delta} (W r^{\epsilon})^z]
其中,(W_0 \ll W \ll W_m) 和 (r_0 \ll r \ll r_m) 定义了时空分形范围;(-1 < z < 0) 和 (-\frac{(n + 1)}{2} < \Delta - \epsilon z < 0) 是可容许条件。具有分形行为的协方差函数为:
[c_{X;p,c_p} = \sigma_X^2 \hat{f}
z (W r^{\epsilon}; u_c) \hat{f}
{\Delta}(r; w_c)]
这里,(\sigma_X^2) 是方差,(u_c) 和 (w_c) 是截断值。该模型中的函数 (\hat{f}_z) 通过 (W r^{\epsilon}) 对时空滞后有不寻常的依赖。对于大的 (W),如果 (r) 足够大,(W r^{\epsilon}) 接近 0,(\hat{f}_z) 值接近 1。关于 (\hat{f}_z),如果 (W_1 r_1^{\epsilon} = W_2 r_2^{\epsilon}),则两对时空点等距,等距时空轮廓方程为 (W r^{\epsilon} = c)。这与高斯时空协方差模型不同,在高斯模型中,等距滞后满足方程 (r^2 \tau_r^2 + W^2 \tau_W^2 = c)。
BME 时空估计和映射依赖于所假设的度量结构,因为依赖模型是大多数映射技术的输入。使用不同的度量结构进行估计,即使是相同数据集且时空依赖由相同函数形式的协方差模型表示,也可能导致不同的时空映射。
3. 时空异质依赖:广义 S/TRF
一类由相关研究提出的异质 S/TRF 比同质平稳 S/TRF 更具一般性。设 (Q_{\theta / \phi}) 是一个时空算子,它通过消除空间中 (\theta) 阶和时间中 (\phi) 阶的异质性,将 S/TRF (X_p = X_{s,t}) 转换为同质平稳属性 (Y_p),即:
[Q_{\theta / \phi}[X_p] = Y_p]
此时,属性 (X_p) 被称为具有空间和时间异质性阶数 (\theta) 和 (\phi) 的广义 S/TRF(STRF - (\theta / \phi))。
广义 S/TRF 提供了属性分布的理论模型,表达了因果影响在时空中的传播方式,并给出了感兴趣尺度上属性动态的信息。对于在包含复杂边界和趋势的域内演化的自然系统,S/TRF 偏离同质平稳性的程度预计会在地理和时间上发生变化。构建局部 (Q_{\theta / \phi}) 算子以在局部邻域内产生同质/平稳属性 (Y_p) 更有意义。参数 (\theta) 和 (\phi) 提供了属性模式变化率的定量评估,异质性水平越低,(\theta) 和 (\phi) 值越小。
属性在时空上的相关性由任意一对 (p) 和 (c_p) 点之间的协方差 (c_{X;p,c_p}) 表征。该协方差在空间上非同质,在时间上非平稳,根据 STRF - (\theta / \phi) 理论,它可以分解为:
[c_{X;p,c_p} = N_{X;p - c_p} + P_{\theta / \phi}]
其中,(N_{X;p - c_p}) 称为广义时空协方差,(P_{\theta / \phi}) 是时空趋势函数。预测和映射仅需要 (N_{X;p - c_p})。例如,在印度黑死病研究中使用的一些 (N_{X;p - c_p}) 模型如下表所示:
| 模型形式 | 说明 |
|---|---|
| (N_{X;r,W} = c \Gamma_r \Gamma_W + \sum_{\gamma = 0}^{\phi} (-1)^{\gamma + 1} a_{\gamma} W^{2\gamma + 1} \Gamma_r + \sum_{\mu = 0}^{\theta} (-1)^{\mu + 1} b_{\mu} r^{2\mu + 1} \Gamma_W + \sum_{\gamma = 0}^{\phi} \sum_{\mu = 0}^{\theta} (-1)^{\mu + \gamma} a_{\mu \gamma} r^{2\mu + 1} W^{2\gamma + 1}) | (c, a_{\gamma}, b_{\mu}, a_{\mu \gamma}) 是根据数据集计算的系数;(\Gamma_r) 和 (\Gamma_W) 分别是空间和时间的狄拉克函数 |
广义协方差 (N_{X;p - c_p}) 可以用剩余普通协方差 (c_{Y;p - c_p}) 表示,因此广义时空协方差类比普通协方差类更丰富。
4. 贝叶斯最大熵(BME)
4.1 基本方程
考虑一个在时空上分布的属性 (X_p),建模为普通或广义 S/TRF。BME 研究 (X_p) 的方法基于以下基本方程组:
[\begin{cases}
\int_{dF_p} (g - \bar{g}) e^{\mathbf{\lambda}^T g} = 0 \
\int_{dF_p [S]} e^{\mathbf{\lambda}^T g} - A f_K(p) = 0
\end{cases}]
其中,(g) 是表示关于物理情况可用的一般知识库(G - KB)的向量,(\mathbf{\lambda}) 是与 (g) 相关的系数向量((\mathbf{\lambda}) 表示 (g) 中每个元素的相对重要性,并取决于时空坐标),([S]) 表示可用的特定地点知识库(S - KB),(A) 是归一化参数,(f_K) 是表示属性 (X_p) 在每个时空点最终分布的概率密度函数(pdf)。(f_K) 考虑了一般和特定地点知识库的整合。(g) 和 ([S]) 是输入,方程中的未知数是时空上的 (\mathbf{\lambda}) 和 (f_K)。
完整的 pdf (f_K) 是许多科学应用和风险评估研究的关键组件。从 (f_K) 可以选择时空属性估计(或预测)(\hat{X}
p)。例如:
- BMEmode 估计:(\hat{X}
{p,mode} = \max_{X_p} f_K)
- BMEmean 估计:(\hat{X}
{p,mean} = \int
{dF_p} F_p f_K)
由于 (X_p) 分布的随机性和数据不准确,使用 (f_K) 来评估 (\hat{X}
p) 值的不确定性。常用的准确性度量是 (f_K) 的预测误差标准(std)偏差:
[V_K(p) = [\int
{dF_p} (F_p - X_p)^2 f_K]^{\frac{1}{2}}]
基本方程 [6.30] 是一个非常通用和简洁的表达式,总结了许多作为其特殊情况的理论和应用结果,具体取决于 (g) 和 ([S]) 的选择,而 (g) 和 ([S]) 又取决于主体的认知条件和问题的目标。
以下是 mermaid 格式流程图,展示 BME 基本方程的相关流程:
graph LR
A[输入 g 和 [S]] --> B[求解基本方程 [6.30]]
B --> C[得到 \(\mathbf{\lambda}\) 和 \(f_K\)]
C --> D[计算 \(\hat{X}_p\)]
C --> E[评估 \(\hat{X}_p\) 的不确定性]
BME 具有以下特点:
- 科学方法论涉及基于大脑和行为功能的进化原则,可在单一方案中涵盖不同现象和跨学科描述。
- 假设时空坐标系能适应欧几里得和非欧几里得度量,考虑属性变异性和潜在物理机制。
- 考虑多源不确定性(概念和技术、本体和认知)。
- 用依赖模型(协方差和变异函数、可分离和不可分离、普通和广义)表示时空模式。
- 可纳入高阶矩。
- 在每个网格点提供基于预测概率定律的完整系统表征,通常是非高斯的。
- 假设非线性属性预测器,而非常用的限制性线性或线性化属性估计器。
- 依赖自然的基于知识的方法论,可严格纳入物理定律、理论模型、科学理论和既定的经验关系。
- 提供有效的贝叶斯同化规则,可考虑不同类型的时空支持和多个属性。
- 可处理分类变量和以模糊集形式表示的次要知识。
许多先前的结果(如空间回归和地质统计克里金技术)可在有限条件下作为 BME 的特殊情况轻松推导得出。BME 可用于解决各种问题,如研究饱和地下水流的反问题、求解代表不同物理定律的随机微分方程、地理信息科学和决策分析中的应用、数据融合和图像处理问题等。
4.2 方法概述
从概念上讲,BME 是认知学背景下多学科知识综合的重要组成部分。认知学建立了一个广泛的框架,在这个框架中,不同学科中描述组成现象的不同心理实体集被整合起来,以解决(描述、解释和预测)复杂的现实世界问题。
BME 的发展(理论和应用)因所涉及的科学学科而异。BME 理论不断在更广泛的概念框架内被研究,而 BME、GBME 等技术已在各种科学学科的实际研究中得到成功应用。以下是 BME 各组成部分的简要概述:
| 组成部分 | 作用 |
|---|---|
| 定量评估 | 生成预测、评估时空依赖、表征不确定性等 |
| 多学科知识库整合 | 为科学、文化、社会、经济等多学科知识库建立通用整合框架 |
| 论证模式澄清 | 明确潜在的论证模式,如分类、类比、数学、实验等 |
与任何动态概念系统一样,BME 理论也面临着一些重大挑战。不过,BME 也有多种扩展形式,具体如下:
-
广义 BME(GBME)
:涉及 STRF - (\theta / \phi) 模型,可直接处理异质时空模式和非高斯数据分布。
-
随机逻辑时空预测器
:为时空预测提供了新的方法。
-
纳入 Spartan 随机场模型
:可以通过物理或直观动机的“相互作用”来表示时空依赖,而不是依赖数据驱动的协方差矩阵。
BME 在实际应用中有诸多示例:
-
饱和地下水流反问题研究
:[SER 03c] 使用 BME 研究饱和地下水流的反问题。具体操作步骤为:首先收集与饱和地下水流相关的各种数据,包括流量、水位等信息,将其作为输入的 (g) 和 ([S]);然后根据 BME 的基本方程 [6.30] 进行求解,得到 (\mathbf{\lambda}) 和 (f_K);接着根据 (f_K) 计算相关的参数估计值 (\hat{X}_p),并评估其不确定性;最后根据计算结果对饱和地下水流的反问题进行分析和解答。
-
随机微分方程求解
:[KOL 02, PAP 06 和 YU 07b] 应用 BME 求解代表不同物理定律的随机微分方程。操作流程为:先确定随机微分方程所描述的物理系统,收集该系统的相关数据作为输入;将数据代入 BME 基本方程进行求解;利用求解得到的结果来确定随机微分方程的解,并评估解的不确定性。
-
地理信息科学和决策分析
:[CHR 02c 和 CHR 06] 提出了 BME 在地理信息科学和多维环境决策分析中的各种应用。具体做法是:收集地理信息和决策相关的数据,构建合适的 (g) 和 ([S]);运用 BME 方法进行计算和分析,得到地理信息的预测和决策的依据;根据计算结果进行地理信息的处理和决策的制定。
-
数据融合和图像处理
:[FAS 07a 和 b, BOG 07] 使用 BME 解决数据融合和图像处理问题。步骤如下:收集不同来源的数据和图像信息,作为输入数据;将这些数据应用 BME 方法进行融合和处理;根据处理结果进行图像的分析和处理,以及数据的综合利用。
以下是 mermaid 格式流程图,展示 BME 应用的一般流程:
graph LR
A[确定应用问题] --> B[收集相关数据作为 g 和 [S]]
B --> C[应用 BME 基本方程求解]
C --> D[得到 \(\mathbf{\lambda}\) 和 \(f_K\)]
D --> E[计算 \(\hat{X}_p\) 并评估不确定性]
E --> F[根据结果解决应用问题]
综上所述,BME 是一种强大而灵活的方法,在环境数据高级映射以及众多科学领域中具有广泛的应用前景。它能够综合考虑多种因素,处理复杂的时空数据和不确定性问题,为解决实际问题提供了有效的工具和方法。同时,其不断发展的扩展形式也为应对更多复杂情况提供了可能。
超级会员免费看
21

被折叠的 条评论
为什么被折叠?



