顺序二样本检验与非参数模式分类器设计
顺序二样本检验问题
顺序二样本检验问题是顺序分类系统非参数设计的基础模型。假设有两个测量向量 $X = [x_1, x_2, …, x_n]^T$ 和 $Y = [y_1, y_2, …, y_n]^T$,分别从某些概率分布中采样得到。问题是要检验这两个分布是否相同,且尽可能使用最少的测量值。
设 $x_1, x_2, …, x_n$ 和 $y_1, y_2, …, y_n$ 是独立随机变量,我们要检验的假设为:
- 原假设 $H_0$:$G = P(X)$
- 备择假设 $H_1$:$G = f(P(X))$
为了使用基于顺序秩的 Wald 序贯概率比检验(SPRT),测量值将交替排列为 $x_1, y_1, x_2, y_2, …, x_n, y_n$。第 $k$ 阶段的组合测量值用向量 $V(k) = [v_1, v_2, …, v_k]$ 表示,其中 $v_1 = x_1$,$v_2 = y_1$ 等。设 $S(k) = [S_1, S_2, …, S_k]$ 是 $V(k)$ 的顺序秩向量。
在原假设 $H_0$ 下,对于 $S(k)$ 的某个结果向量 $S$,$P_0(S(k) = S/H_0) = 1/k!$。因此,$P_1(S(k) = S/H_1)$ 可以通过注意到每个结果 $S$ 与 $x_i$ 和 $y_i$ 的组合测量值的特定排序一一对应来计算。即,只需计算:
[P(u_1 < u_2 < … < u_k/H_1) = \int_{-\infty}^{\infty} … \int_{t_1 < t_2 < … < t_k < \
超级会员免费看
订阅专栏 解锁全文
985

被折叠的 条评论
为什么被折叠?



