分形分析:Lévy、Hurst、DFA、DEA 相关知识解析
在金融、物理、生物等众多领域,对随机过程和时间序列的研究至关重要。本文将深入探讨分形分析中的一些关键概念和方法,包括 Lévy 过程、Lévy 飞行模型、Hurst 分析以及 Detrended Fluctuation Analysis(DFA)等。
1. Lévy 过程
Lévy 过程是一类重要的随机过程,在金融建模等领域有着广泛的应用。常见的 Lévy 过程包括 Poisson 过程、Inverse Gaussian(IG)过程和 Gamma 过程。
1.1 Poisson 过程
Poisson 过程是一种基本的计数过程,其强度为 $\lambda$。Poisson 分布的各阶矩如下表所示:
| 分布 | 均值 | 方差 | 偏度 | 峰度 |
| ---- | ---- | ---- | ---- | ---- |
| Poisson ($\lambda$) | $\lambda$ | $\lambda$ | $\frac{1}{\sqrt{\lambda}}$ | $3 + \lambda^{-1}$ |
1.2 Inverse Gaussian(IG)过程
Inverse Gaussian(IG)过程 ${Y(t); t \geq 0}$ 满足以下性质:
- $Y(t)$ 具有独立增量,即对于所有 $t_2 > t_1 \geq s_2 > s_1$,$Y(t_2) - Y(t_1)$ 和 $Y(s_2) - Y(s_1)$ 相互独立。
- 对于所有 $t > s \geq 0$,$Y(t) - Y(s)$ 服从 IG 分布 $\mathcal{I}\mathcal{G}(\Lambda(t) - \Lambda(s), \eta[\Lambda(t) - \Lambda(s)]^2)$,其中 $\Lambda(t)$ 是单调递增函数,IG 分布的概率密度函数(PDF)为:
[f_{\mathcal{I}\mathcal{G}}(y; a, b) = \sqrt{\frac{b}{2\pi y^3}} \exp\left[-\frac{b(y - a)^2}{2a^2 y}\right], y > 0]
定义 $T_{(a,b)}$ 为具有漂移 $b > 0$ 的标准布朗运动首次达到正水平 $a > 0$ 的时间,$T_{a,b}$ 服从 IG 分布,其特征函数为:
[\phi(z; a, b) = \exp(-a(\sqrt{-2iz + b^2} - b))]
IG 分布是无穷可分的,IG 过程 $IG(a, b)$ 可以定义为从 0 开始,具有独立平稳增量的随机过程,使得:
[E[\exp(izX_t)] = \phi(z; at, b) = \exp(-at(\sqrt{-2iz + b^2} - b))]
1.3 Gamma 过程
Gamma 过程 $X = {X_t, t \geq 0}$ 具有参数 $a$ 和 $b$,需满足以下条件:
1. $X_0 = 0$。
2. 过程具有独立平稳增量。
3. 对于 $s < t$,随机变量 $X_t - X_s$ 服从 $\Gamma(a(t - s), b)$ 分布。
Gamma 分布 $\Gamma(a, b)$ 的概率密度函数为:
[f_X(x; a, b) = \frac{b^a}{\Gamma(a)} x^{a - 1} e^{-bx}, \forall x > 0]
Gamma 分布的各阶矩如下表所示:
| 分布 | 均值 | 方差 | 偏度 | 峰度 |
| ---- | ---- | ---- | ---- | ---- |
| $\Gamma(a, b)$ | $\frac{a}{b}$ | $\frac{a}{b^2}$ | $\frac{2}{\sqrt{a}}$ | $3(1 + 2a^{-1})$ |
Gamma 过程是一个非递减的 Lévy 过程,其特征函数为:
[\phi(z; a, b) = \left(1 - \frac{iz}{b}\right)^{-a}]
1.4 指数 Lévy 模型
在金融资产定价中,假设 $(\Omega, \mathcal{F}, \mathcal{F} t, \mathbb{P})$ 是一个过滤概率空间,$(S_t) {t \in [0,T]}$ 是金融资产的价格,建模为该空间上的随机过程。在无套利假设下,存在一个与 $\mathbb{P}$ 等价的测度 $\mathbb{Q}$,使得所有交易金融资产的贴现价格是 $\mathbb{Q}$ - 鞅。
在指数 Lévy 模型中,资产价格 $S_t$ 在 $\mathbb{Q}$ 下的动态表示为:
[S_t = S_0 e^{rt + X_t}]
其中 $X_t$ 是一个 Lévy 过程(在 $\mathbb{Q}$ 下),具有特征三元组 $(\sigma, \gamma, \nu)$,$r$ 是利率。无套利条件要求贴现后的资产价格 $\hat{S}_t = S_t e^{-rt} = \exp X_t$ 是一个鞅。
1.5 Lévy 过程的从属关系
从属关系是通过一个独立于原过程的递增随机过程(从属过程)进行随机时间变换,将一个随机过程转换为新的随机过程。从属过程是一维的、几乎必然非递减的 Lévy 过程。
如果 $T$ 是一个从属过程,其 Lévy 符号具有以下形式:
[\eta(z) = ibz + \int_{0}^{\infty} (e^{izy} - 1) \lambda(dy)]
其中 $b \geq 0$,Lévy 测度 $\lambda$ 满足 $\lambda(-\infty, 0) = 0$ 且 $\int_{0}^{\infty} (y \wedge 1) \lambda(dy) < \infty$。
常见的从属过程例子包括 Poisson 过程、复合 Poisson 过程(当式 (21.7) 中的 $\chi_k$ 均为 $\mathbb{R}^+$ - 值时)和 Gamma 过程。
2. Lévy 飞行模型
Lévy 飞行模型是稳定分布的一种推广。考虑 $n$ 个独立同分布(i.i.d.)随机变量 $x_i$ 的和:
[S_n = x_1 + x_2 + x_3 + \cdots + x_n = x(n\Delta t)]
$S_n$ 可以看作 $n$ 个随机变量的和,也可以看作单个游走者在时间 $t = n\Delta t$ 时的位置。由于变量相互独立,其和可以通过卷积得到。
一个分布被称为稳定分布,如果 $P[x(n\Delta t)]$ 的函数形式与 $P[x(\Delta t)]$ 的函数形式相同。具体来说,对于随机变量 $X$,如果对于任何 $n \geq 2$,存在正数 $C_n$ 和数 $D_n$,使得:
[Law(X_1 + X_2 + \cdots + X_n) = Law(C_nX + D_n)]
其中 $X_1, X_2, \cdots, X_n$ 是 $X$ 的独立随机副本,则称 $X$ 是稳定的。如果 $D_n = 0$,则 $X$ 是严格稳定变量。可以证明,$C_n = n^{\frac{1}{\alpha}}$,其中 $0 < \alpha \leq 2$。
稳定分布的特征函数定义如下:
当 $\alpha = 1$ 时:
[\ln(\varphi(q)) = \mu q - \gamma |q| \left[1 + i\beta \frac{q}{|q|} \frac{2}{\pi} \log(q)\right]]
当 $\alpha \neq 1$ 时:
[\ln(\varphi(q)) = i\mu q - \gamma |q|^{\alpha} \left[1 - i\beta \frac{q}{|q|} \tan\left(\frac{\pi\alpha}{2}\right)\right]]
其中 $\gamma$ 是正的尺度因子($\gamma^2 = \sigma^2$(方差)),$\mu$ 是实值常数(位置参数或均值),$-1 \leq \beta \leq 1$ 是偏度参数。
对于中心对称分布($\beta = 0, \mu = 0$),特征函数为:
[\varphi(q) = \exp(-\gamma |q|^{\alpha})]
稳定 Lévy 分布((21.14) 的傅里叶变换)定义为:
[P_L(x) = \frac{1}{\pi} \int_{0}^{\infty} \exp(-\gamma |q|^{\alpha}) \cos(qx) dq]
为了避免稳定 Lévy 过程在 $\alpha < 2$ 时出现无限二阶矩的问题,引入了截断 Lévy 飞行(Truncated Lévy Flight,TLF)。TLF 分布定义为:
[T(x) = cP(x) \chi_{(-l,l)}(x)]
其中 $P(x)$ 是对称 Lévy 分布。为了改进 TLF 的收敛性,Koponen 提出了具有特征函数的 TLF:
[\varphi(q) = \exp\left[c_0 - c_1 \frac{(q^2 + 1/l^2)^{\alpha/2}}{\cos(\pi\alpha/2)} \cos(\alpha \arctan(l |q|))\right]]
其中:
[c_1 = \frac{2\pi \cos(\pi\alpha/2)}{\alpha \Gamma(\alpha) \sin(\pi\alpha)} A_t]
[c_0 = \frac{2\pi}{\alpha \Gamma(\alpha) \sin(\pi\alpha)} A l^{-\alpha} t]
3. 重标极差分析(Hurst 分析)
重标极差分析(Rescaled-Range analysis,R/S)由 Hurst 在研究尼罗河水位的长期变化时首次提出。该方法得到的参数 $H$ 被称为 Hurst 指数,它代表时间序列的相对趋势,取值范围在 0 到 1 之间。当 $H = \frac{1}{2}$ 时,表示过程具有独立增量,对应标准布朗运动;当 $0.5 < H < 1$ 时,表明时间序列存在长程相关性;当 $0 < H < 0.5$ 时,时间序列具有反持久性行为(负自相关)。
估计 Hurst 指数的数值步骤如下:
1. 设时间序列 $(y_1, y_2, y_3, \cdots, y_N)$ 的长度为 $N$,计算时间序列的对数比,新时间序列 $M(t)$ 的长度为 $N - 1$:
[M(t) = \log\left(\frac{y_{t + 1}}{y_t}\right), t = 1, 2, \cdots, N - 1]
2. 将时间序列划分为 $m$ 个子序列,每个子序列长度为 $n$,满足 $m \cdot n = N - 1$。每个子序列标记为 $Q_a$,其中 $a = 1, 2, \cdots, m$,子序列中的元素标记为 $L_{k,a}$,$k = 1, 2, \cdots, n$。
3. 计算每个子序列 $Q_a$ 的平均值:
[Z_a = \frac{1}{n} \sum_{k = 1}^{n} L_{k,a}]
4. 计算每个子序列 $Q_a$ 的累积偏差:
[C_{k,a} = \sum_{j = 1}^{k} (L_{j,a} - Z_a), k = 1, 2, \cdots, n]
5. 计算每个子序列 $Q_a$ 的极差:
[R(Q_a) = \max (C_{k,a}) - \min (C_{k,a})]
6. 计算每个子序列 $Q_a$ 的标准差:
[S(Q_a) = \sqrt{\frac{1}{n} \sum_{j = 1}^{n} (L_{j,a} - Z_a)^2}]
7. 对每个子序列进行归一化,将极差 $R(Q_a)$ 除以标准差 $S(Q_a)$,得到长度为 $n$ 的子序列的 $R/S$ 平均值:
[(R/S)
n = \frac{1}{m} \sum
{a = 1}^{m} \frac{R(Q_a)}{S(Q_a)}]
8. 重复步骤 2 到 7,对所有可能的 $n$ 值进行计算,得到每个 $n$ 对应的 $R/S$ 值。子序列长度 $n$ 与重标极差 $R/S$ 的关系为:
[(R/S) = (cn)^H]
取对数可得:
[\log(R/S) = H \log c + H \log n]
9. 以 $\log(R/S)$ 为因变量,$\log(n)$ 为自变量进行普通最小二乘回归,回归方程的斜率即为 Hurst 指数 $H$ 的估计值。
下面是 Hurst 分析步骤的 mermaid 流程图:
graph TD;
A[开始] --> B[计算对数比序列 M(t)];
B --> C[划分时间序列为子序列];
C --> D[计算子序列平均值 Za];
D --> E[计算累积偏差 Ck,a];
E --> F[计算极差 R(Qa)];
F --> G[计算标准差 S(Qa)];
G --> H[计算 R/S 平均值 (R/S)n];
H --> I{是否遍历所有 n 值};
I -- 否 --> C;
I -- 是 --> J[进行回归计算 Hurst 指数 H];
J --> K[结束];
4. 去趋势波动分析(DFA)
去趋势波动分析(Detrended Fluctuation Analysis,DFA)是揭示非平稳时间序列长程相关性的重要技术。该方法由 Peng 等人在 1993 年和 1994 年提出,并成功应用于多个领域,如云层破碎研究、DNA 分析、心脏动力学研究、气候研究、固态物理和经济时间序列分析等。
DFA 方法的优点在于它能够检测出看似非平稳时间序列中内在的自相似性,同时避免因外在趋势导致的虚假自相似性检测。
估计 DFA 指数的数值步骤如下:
1. 设时间序列 $(y_1, y_2, y_3, \cdots, y_N)$ 的长度为 $N$,计算时间序列的对数比,新时间序列 $M(t)$ 的长度为 $N - 1$:
[M(t) = \log\left(\frac{y_{t + 1}}{y_t}\right), t = 1, 2, \cdots, N - 1]
2. 对 $M(t)$ 的绝对值进行积分:
[y(t) = \sum_{i = 1}^{t} |M(i)|]
3. 将积分后的时间序列划分为 $m$ 个长度为 $n$ 的不相交的盒子。由于数据划分可能会有剩余,从序列末尾重复相同的划分过程,得到 $\frac{2N}{n}$ 个盒子。
4. 对每个盒子拟合最小二乘直线,得到每个盒子的趋势 $y_n(t)$。
5. 使用以下公式计算均方根波动(RMSF):
[F(n) = \sqrt{\frac{1}{2N} \sum_{t = 1}^{2N} [y(t) - y_n(t)]^2}]
6. 对所有盒子大小 $n$ 重复上述计算,以表征盒子大小 $n$ 与 $F(n)$ 之间的关系。在对数 - 对数图中,$F(n)$ 与 $n$ 之间的线性关系表明波动可以用一个标度指数 $H$ 来表征,即:
[F(n) \propto n^H]
下面是 DFA 分析步骤的 mermaid 流程图:
graph TD;
A[开始] --> B[计算对数比序列 M(t)];
B --> C[积分得到 y(t)];
C --> D[划分时间序列为盒子];
D --> E[拟合最小二乘直线得到 yn(t)];
E --> F[计算均方根波动 F(n)];
F --> G{是否遍历所有盒子大小 n};
G -- 否 --> D;
G -- 是 --> H[确定标度指数 H];
H --> I[结束];
综上所述,Lévy 过程、Lévy 飞行模型、Hurst 分析和 DFA 方法在不同领域都有着重要的应用。Lévy 过程为金融资产定价等提供了理论基础;Lévy 飞行模型则在处理具有长程相关性的随机过程中发挥作用;Hurst 分析和 DFA 方法可以帮助我们检测时间序列中的长程相关性,从而更好地理解和预测各种自然和社会现象。通过这些方法,我们能够深入挖掘时间序列中的隐藏信息,为相关领域的研究和决策提供有力支持。
分形分析:Lévy、Hurst、DFA、DEA 相关知识解析
5. 分数布朗运动(FBM)
分数布朗运动(Fractional Brownian motion,FBM)是布朗运动的一种推广,与 Hurst 指数参数 $H$ 有着密切的关系。
5.1 FBM 的定义
设 $B(t)$ 为普通布朗运动,Hurst 指数参数 $H$ 满足 $0 < H < 1$。则指数为 $H$ 的 FBM 是 $dB(t)$ 的一个移动平均,其中 $B(t)$ 的过去增量由核 $(t - s)^{H - \frac{1}{2}}$ 加权。
5.2 FBM 的应用
- 经济学 :经济时间序列通常呈现出各种规模的周期,最慢的周期持续时间与总样本大小相当。FBM 可以为这些经济时间序列提供有用的模型。
- 固体波动研究 :许多固体中的波动被称为 $1/f$ 噪声,因为它们的样本谱密度形式为 $\lambda^{1 - 2H}$,其中 $\lambda$ 是频率,$H$ 通常满足 $\frac{1}{2} < H < 1$,且常常接近 1。
- 水文学 :水文学中的现象通常表现出极长的相互依赖性,FBM 可以用于描述这些现象。
当 $H = \frac{1}{2}$ 时,FBM 就是标准布朗运动,它是一个具有短记忆的马尔可夫过程。马尔可夫过程是指其未来概率仅由其最近的值决定的随机过程。如果 $H < \frac{1}{2}$,过程的增量是负相关的,表现出幂律衰减。
6. 不同方法的比较与总结
为了更清晰地了解上述各种方法和概念,下面对它们进行一个比较和总结。
| 方法/概念 | 主要用途 | 关键参数 | 适用场景 |
|---|---|---|---|
| Lévy 过程 | 金融建模、随机过程描述 | 特征三元组 $(\sigma, \gamma, \nu)$ 等 | 金融资产价格建模、具有跳跃特征的随机过程 |
| Lévy 飞行模型 | 处理具有长程相关性的随机过程 | $\alpha$、$\gamma$、$\mu$、$\beta$ | 物理学、金融学中长程相关现象 |
| Hurst 分析 | 检测时间序列长程相关性 | Hurst 指数 $H$ | 各种时间序列,如金融、水文等 |
| DFA | 揭示非平稳时间序列长程相关性 | 标度指数 $H$ | 非平稳时间序列,如生物、气候等 |
| FBM | 描述具有特定相关性的随机过程 | Hurst 指数 $H$ | 经济、固体波动、水文等领域 |
从这些方法的特点来看,Lévy 过程和 Lévy 飞行模型侧重于理论建模,为随机过程提供了数学基础;而 Hurst 分析、DFA 和 FBM 则更侧重于对时间序列的分析和应用。
7. 实际应用案例
下面通过一个简单的经济时间序列分析案例,展示上述方法的实际应用。
假设我们有一个股票价格的时间序列 $(y_1, y_2, \cdots, y_N)$,我们希望分析该序列的长程相关性。
7.1 Hurst 分析应用
-
步骤 1
:计算对数比序列 $M(t)$
[M(t) = \log\left(\frac{y_{t + 1}}{y_t}\right), t = 1, 2, \cdots, N - 1] - 步骤 2 :划分时间序列为子序列,计算子序列的平均值、累积偏差、极差、标准差等,得到不同长度子序列的 $R/S$ 平均值。
-
步骤 3
:进行回归分析,计算 Hurst 指数 $H$。
- 如果 $H = \frac{1}{2}$,说明股票价格序列可能是随机游走的,未来价格不受过去价格的影响。
- 如果 $0.5 < H < 1$,表明股票价格序列存在长程相关性,过去的价格走势可能会影响未来的价格,具有一定的趋势性。
- 如果 $0 < H < 0.5$,则股票价格序列具有反持久性行为,价格可能会频繁反转。
7.2 DFA 分析应用
- 步骤 1 :同样计算对数比序列 $M(t)$。
- 步骤 2 :对 $M(t)$ 的绝对值进行积分得到 $y(t)$。
- 步骤 3 :划分时间序列为盒子,拟合最小二乘直线,计算均方根波动 $F(n)$。
- 步骤 4 :确定标度指数 $H$。通过 $H$ 的值可以进一步验证时间序列的长程相关性情况,与 Hurst 分析结果相互印证。
8. 未来研究方向展望
随着科技的不断发展和数据量的不断增加,分形分析领域还有许多值得深入研究的方向。
- 多尺度分析 :目前的方法大多集中在单一尺度上进行分析,未来可以考虑发展多尺度的分析方法,以更全面地捕捉时间序列中的信息。例如,结合不同尺度下的 Hurst 指数或 DFA 指数,更准确地描述时间序列的复杂性。
- 深度学习与分形分析的结合 :深度学习在处理复杂数据方面具有强大的能力,可以尝试将深度学习算法与分形分析方法相结合,提高对时间序列长程相关性的检测和预测能力。例如,使用神经网络来自动学习时间序列中的特征,辅助计算 Hurst 指数或其他相关参数。
- 跨学科应用拓展 :分形分析已经在多个学科中得到了应用,但仍有许多领域可以进一步探索。例如,在医学领域,分析生物信号的长程相关性可能有助于疾病的早期诊断;在环境科学中,研究气象数据的分形特征可以更好地预测气候变化。
总之,分形分析中的 Lévy 过程、Lévy 飞行模型、Hurst 分析、DFA 和 FBM 等方法为我们理解和分析随机过程和时间序列提供了强大的工具。通过不断地研究和创新,我们有望在更多领域中发现这些方法的潜在价值,为解决实际问题提供更有效的方案。
下面是一个综合应用流程的 mermaid 流程图:
graph TD;
A[获取时间序列数据] --> B{Hurst 分析};
B -- 计算 H --> C{判断 H 范围};
C -- 0 < H < 0.5 --> D[反持久性行为分析];
C -- H = 0.5 --> E[随机游走分析];
C -- 0.5 < H < 1 --> F[长程相关性分析];
B --> G{DFA 分析};
G -- 计算标度指数 H --> C;
F --> H[结合 FBM 进一步分析];
D --> I[考虑跨尺度或结合深度学习];
E --> J[探索其他特征];
H --> K[应用于实际场景];
I --> K;
J --> K;
通过这个流程图,我们可以看到在实际应用中,如何综合运用这些方法对时间序列进行全面的分析,并将结果应用到实际场景中。
希望本文对分形分析相关知识的介绍能够帮助读者更好地理解这些方法的原理和应用,激发更多的研究和实践。在未来的研究中,我们可以不断探索这些方法的新应用和改进,为各个领域的发展做出贡献。
超级会员免费看

被折叠的 条评论
为什么被折叠?



