36、统计推断中的抽样与停止变量相关理论

统计推断中的抽样与停止变量相关理论

1. 渐近有效抽样过程与方法

当 $d^2$ 未知时,定义一个抽样过程,假设 $N(d)$ 是其停止变量(当抽样停止时公式 (II.1) 成立)。若 $N(d)$ 满足以下公式:
$\lim_{d \to \infty} \frac{n_0(d, s)}{E_{m,s}{N(d)}} \approx 1; c(m, s)$
则该过程称为渐近有效过程,相应的方法称为具有固定宽度均值置信区间的渐近有效检验方法,记为 ASM。这里假设 $x_i$ 的分布为 $N(m, d^2)$。

2. 相关定义与命题
2.1 定义 3.2.1

设 $n_1, n_2 \geq 2$。对于每个 $n \geq n_1$,计算 $S_n^2 = \frac{1}{n - 1} \sum_{i = 1}^{n} (x_i - \bar{x}_n)^2$。定义停止变量 $N(d)$ 为满足以下公式的最小整数:
$n \geq \left[n_1, \frac{a_n^2 S_n^2}{d^2}\right]$ (II.2)
其中,$a_n$ 是一系列正的常数,且收敛于 $a$,$a = F^{-1}(\frac{1 + g}{2})$。

2.2 命题 3.2.1

假设 $N(d)$ 是由公式 (II.2) 定义的停止变量,则有以下性质:
1. $c(m, s); P(N(d) < \infty) = 1$
2. 若 $d_1 < d_2$,则 $N(d_1) \geq N(d_2); a.s$ 且 $\lim_{d \to \infty} N(d) = \infty; a.s$(符号 $a.s$ 表示几乎处处)
3. $E_s{N(d)} < \infty; \forall s \in (0, \infty)$,$d \in (0, \infty)$ 成立
4. $\lim_{d \to \infty} \frac{N(d)}{n_0(d,s)} = 1; a.s \forall s \in (0, \infty)$
5. $\lim_{d \to \infty} \frac{E_s{N(S)}}{n_0(d,s)} = 1; a.s \forall s \in (0, \infty)$
6. $P_s{N(d) > n} \sim O(n^{-\frac{3}{2}} \exp(-\frac{1}{2n^2}))$

以下是这些性质的关系流程图:

graph LR
    A[N(d)由公式(II.2)定义] --> B[性质1: P(N(d) < ∞) = 1]
    A --> C[性质2: d1 < d2时, N(d1) ≥ N(d2)且lim N(d) = ∞]
    A --> D[性质3: Es{N(d)} < ∞]
    A --> E[性质4: lim N(d)/n0(d,s) = 1]
    A --> F[性质5: lim Es{N(S)}/n0(d,s) = 1]
    A --> G[性质6: Ps{N(d) > n} ~ O(n^(-3/2) exp(-1/2n^2))]
2.3 命题 3.2.2

在公式 (II.2) 中,令 $a_n \to a$ 并假设 $N(d)$ 是相应的停止变量,则对于 $n \geq n_1$,有
$E_s{N(d)} \leq n_0(d, s) + n_1 + 1; \forall d > 0, 0 < s < \infty$

2.4 命题 3.2.3

在公式 (II.2) 中,令 $a_n \to a$,$n_1 \geq 3$,则对于有限的 $k \geq 0$,使得对于 $c(m, s); d > 0$,$P_{m,s}{|x_{N + k} - m| < d} \geq g$。

3. 一般情况
3.1 定义 3.2.2

定义 $N(d)$ 为满足以下公式的最小整数:
$n \geq \frac{a_n^2}{d^2} \left(1 + \frac{1}{n} \sum_{i = 1}^{n} (x_i - \bar{x}_n)^2\right)$ (II.3)
其中,$a_n$ 是一系列正的常数,且收敛于 $a$,$a = F^{-1}(\frac{1 + g}{2})$。

3.2 命题 3.2.4

假设 ${n_n; n = 1, 2, \cdots}$ 是一系列几乎处处为正的随机变量,且 $\lim_{n \to \infty} n_n = 1; a.s$。设 $f(n)$ 是一系列满足以下条件的常数:
$f(n) > 0; \lim_{n \to \infty} \frac{f(n)}{f(n - 1)} = 1$
对于 $\forall t > 0$,定义 $N(t)$ 为满足以下公式的最小整数:
$f(k) \geq t n_k; k \geq 1$
则 $N(t)$ 是 $t$ 的非递减停止变量,且:
1. $P(N(t) < \infty) < 1$
2. $\lim_{t \to \infty} N(t) = \infty$
3. $\lim_{t \to \infty} E(N(t)) = \infty$
4. $\lim_{t \to \infty} \frac{f(N(t))}{t} = 1; a.s$。
如果 $E\left[\sup_{n \geq 1} n_n\right] < \infty$,则 $\lim_{t \to \infty} E_F\left[\frac{f(N(t))}{t}\right] = 1; \forall F \in T$。

以下是命题 3.2.4 各性质的表格总结:
| 性质编号 | 性质内容 |
| ---- | ---- |
| 1 | $P(N(t) < \infty) < 1$ |
| 2 | $\lim_{t \to \infty} N(t) = \infty$ |
| 3 | $\lim_{t \to \infty} E(N(t)) = \infty$ |
| 4 | $\lim_{t \to \infty} \frac{f(N(t))}{t} = 1; a.s$ |
| 附加条件 | 若 $E\left[\sup_{n \geq 1} n_n\right] < \infty$,则 $\lim_{t \to \infty} E_F\left[\frac{f(N(t))}{t}\right] = 1; \forall F \in T$ |

3.3 命题 3.2.5(Chow - Robbins 定理)

假设 $N(d)$ 是由公式 (II.3) 定义的停止变量,则:
1. $P(N(d) < \infty) = 1$
2. 当 $d$ 单调趋于 0 时,$N(d)$ 几乎处处单调趋于 $\infty$
3. $\lim_{d \to \infty} \frac{d^2 N(d)}{a^2 s^2(F)} = 1; a.s; \forall F \in T$
如果 $E\left[\sup_{n \geq 1} S_n^2\right] < \infty$,则
4. $\lim_{d \to \infty} \frac{d^2 (N(d))}{a^2 s^2(F)} = 1$
其中,$s^2(F)$ 是 $F$ 的方差,$T$ 是所有具有有限二阶矩的分布函数的集合。

3.4 命题 3.2.6

${x_n}$ 是独立同分布的,$E(x_1) = 0$ 且 $E(x_1^2) = 1$。设 $S_n = \sum_{i = 1}^{n} x_i$。$N(t)$ 是一个正的随机整数,$t > 0$,且满足
$\lim_{t \to \infty} \frac{N(t)}{t} = c; 0 < c < \infty$
则有
$\lim_{t \to \infty} P\left(\frac{1}{\sqrt{N(t)}} S_{N(t)} \leq x\right) = F(x); -\infty < x < \infty$
其中,$\lim_{t \to \infty}$ 是依测度收敛极限,$F(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{x} \exp(-\frac{t^2}{2}) dt$。此命题是普通中心极限定理的扩展,普通定理中 $N$ 是常数变量,而这里 $N(t)$ 是随机变量。

3.5 命题 3.2.7

设 ${x_n}$ 是满足以下性质的随机变量序列:
1. 存在实数 $q$、分布函数 $F(x)$ 和一系列实数 ${u_n}$,使得对于 $F$ 的所有连续点,以下公式成立:
$\lim_{n \to \infty} P{x_n - q \leq u_n x} = F(x)$
2. $\forall \epsilon > 0; h > 0$,存在足够大的 $n_0$ 和足够小的正数 $c$,使得当 $n > n_0$ 时有
$P{|x_{n_0} - x_n| < \epsilon u_n \text{ 且 } n_0; |n_0 - n| < c n} > 1 - h$
设 ${n(t)}$ 是一个递增的整数序列,且 $n(t) \to \infty$。设 $N(t)$ 是一个停止变量,$P(N(t) < \infty) < 1$ 且 $\lim_{t \to \infty} \frac{N(t)}{n(t)} = 1; a.s$。则对于 $F(x)$ 的所有连续点,有
$\lim_{t \to \infty} P{x_{N(t)} - q \leq u_{n(t)} x} = F(x)$

统计推断中的抽样与停止变量相关理论(续)

4. 各命题的综合分析与应用思路

上述一系列命题围绕抽样过程中的停止变量展开,为统计推断提供了重要的理论基础。下面对这些命题的综合应用思路进行分析:

4.1 渐近有效抽样的应用

渐近有效抽样过程(ASM)在实际应用中,当总体方差 $d^2$ 未知时,可以通过合理定义停止变量 $N(d)$ 来控制抽样过程。例如,在质量控制领域,我们需要对产品的某个指标进行抽样检测,以确定产品是否符合质量标准。利用 ASM 方法,我们可以根据样本数据动态地决定何时停止抽样,从而在保证一定精度的前提下,减少抽样成本。

具体操作步骤如下:
1. 确定初始参数:设定 $n_1$、$g$ 等参数,根据 $a = F^{-1}(\frac{1 + g}{2})$ 计算 $a$ 的值。
2. 进行抽样:从总体中抽取样本,计算样本均值 $\bar{x}_n$ 和样本方差 $S_n^2$。
3. 判断停止条件:根据定义的停止变量公式(如公式 (II.2) 或 (II.3)),判断是否满足停止条件。如果满足,则停止抽样;否则,继续抽取样本。
4. 进行统计推断:根据抽样得到的样本数据,进行均值估计、假设检验等统计推断。

4.2 停止变量性质的应用

命题 3.2.1 到命题 3.2.3 给出了停止变量 $N(d)$ 的一些重要性质,这些性质可以帮助我们更好地理解抽样过程的收敛性和稳定性。例如,性质 2 表明,当 $d$ 减小时,停止变量 $N(d)$ 会增大,这意味着在要求更高精度时,需要抽取更多的样本。性质 4 和性质 5 则说明了停止变量 $N(d)$ 与理论抽样量 $n_0(d,s)$ 的渐近关系,这对于评估抽样方法的效率非常重要。

在实际应用中,我们可以利用这些性质来优化抽样策略。例如,根据性质 3,我们可以知道停止变量 $N(d)$ 的期望是有限的,这意味着在一定条件下,抽样过程不会无限进行下去。我们可以根据这个性质来设置抽样的最大次数,以避免出现无限抽样的情况。

4.3 一般情况命题的应用

命题 3.2.4 到命题 3.2.7 主要针对一般情况下的停止变量进行了讨论。这些命题在处理更复杂的抽样问题时非常有用。例如,命题 3.2.6 是普通中心极限定理的扩展,它允许停止变量 $N(t)$ 是随机变量,这在实际应用中更为常见。在金融领域,我们可以利用这个命题来对资产价格的波动进行建模和预测。

具体操作步骤如下:
1. 确定随机变量序列:定义 ${x_n}$ 为独立同分布的随机变量序列,满足 $E(x_1) = 0$ 且 $E(x_1^2) = 1$。
2. 确定停止变量:根据实际问题,确定停止变量 $N(t)$,并满足 $\lim_{t \to \infty} \frac{N(t)}{t} = c; 0 < c < \infty$。
3. 进行统计推断:根据命题 3.2.6 的结论,计算 $\lim_{t \to \infty} P\left(\frac{1}{\sqrt{N(t)}} S_{N(t)} \leq x\right)$ 的值,从而对随机变量的分布进行推断。

5. 总结

本文主要介绍了统计推断中抽样过程的渐近有效理论,以及相关停止变量的定义和性质。通过一系列命题的阐述,我们了解了如何在总体方差未知的情况下,通过合理定义停止变量来控制抽样过程,并进行有效的统计推断。

这些理论和方法在实际应用中具有重要的价值,例如在质量控制、金融分析、医学研究等领域都可以发挥重要作用。在实际应用中,我们需要根据具体问题的特点,选择合适的抽样方法和停止变量定义,以达到最优的抽样效果。

以下是整个抽样过程的流程图总结:

graph LR
    A[开始抽样] --> B[计算样本统计量]
    B --> C{是否满足停止条件?}
    C -- 是 --> D[停止抽样]
    C -- 否 --> B
    D --> E[进行统计推断]

通过上述内容,我们对统计推断中的抽样过程和停止变量有了更深入的理解,希望这些内容能够为实际应用提供有益的参考。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值