蓄水池采样
蓄水池抽样就像是在向池中加水的过程中进行抽样,类比于对数据流进行抽样。
N是总共样本个数;k是从中采样k个样本;
sample size: k
for i = 0 to N
if i < k
choose ith value
else
M = random(0,i)
if M < k
swap Mth value and ith value
end for
本文介绍了一种从大量数据流中随机抽取固定大小样本的算法——蓄水池抽样。该算法通过类比向池中加水的过程,有效地解决了在无法预知数据流长度的情况下进行抽样的难题。
蓄水池抽样就像是在向池中加水的过程中进行抽样,类比于对数据流进行抽样。
N是总共样本个数;k是从中采样k个样本;
sample size: k
for i = 0 to N
if i < k
choose ith value
else
M = random(0,i)
if M < k
swap Mth value and ith value
end for
661

被折叠的 条评论
为什么被折叠?