基于自助法的泄漏检测技术解析
1. 自助集生成算法
自助集生成算法是整个泄漏检测流程的基础步骤。以下是生成自助集的算法:
Algorithm 1: Generating Bootstrapping Sets
Input: Sobs = {s1, ..., sn} with n, b ∈Z>0
Output: {S′1, ..., S′b}
1 for i = 1 to b do
2 for i = 1 to n do
3 s′j ← {s1, ..., sn} ;
4 end
5 S′i ← {s′1, ..., s′n} ;
6 end
7 return {S′1, ..., S′b}
此算法的输入为观测集 $S_{obs}$,包含 $n$ 个样本,同时指定了自助集的数量 $b$。通过两层循环,从原观测集中有放回地随机抽取样本,生成 $b$ 个自助集。每个自助集包含 $n$ 个样本,最终返回这 $b$ 个自助集。
2. 柯尔莫哥洛夫 - 斯米尔诺夫检验
在本文中,还应用了单样本柯尔莫哥洛夫 - 斯米尔诺夫检验(KS 检验)。该检验用于衡量样本分布与定义分布之间的差异。
- 原假设与备择假设 :原假设 $H_0$ 为样本来自定义分布,备择假设 $H_a$ 为样本具有不同的分布。
- 经验分布函数 :对于数据集中的样本 $(s_1, s_2, …, s_n)$,任意数 $x$ 的经验分布函数值是小于 $x$ 的数据所占的比