1、已知Var(�n) ≤5 × 10⁻⁵,求能保证测试集误差估计量̂�n,m的标准差至多为1%的最小测试点数m。
可利用
$$
\text{Var}(\hat{p} {n,m}) = E[V {\text{int}}] + \text{Var}[p_n]
$$
以及
$$
V_{\text{int}} = \frac{p_n(1 - p_n)}{m} \quad (V_{\text{int}} \leq \frac{1}{4m})
$$
结合标准差为1%即
$$
\sqrt{\text{Var}(\hat{p}_{n,m})} \leq 0.01
$$
来求解 $ m $。
由于
$$
\text{Var}(p_n) \leq 5 \times 10^{-5}
$$
且
$$
V_{\text{int}} \leq \frac{1}{4m}
$$
那么
$$
\text{Var}(\hat{p}_{n,m}) \leq \frac{1}{4m} + 5 \times 10^{-5}
$$
令
$$
\sqrt{\frac{1}{4m} + 5 \times 10^{-5}} \leq 0.01
$$
解不等式
$$
\frac{1}{4m} + 5 \times 10^{-5} \leq 0.0001
$$
$$
\frac{1}{4m} \leq 0.0001 - 5 \times 10^{-5} = 5 \times 10^{-5}
$$
$$
m \geq \frac{1}{4 \times 5 \times 10^{-5}} = 5000
$$

最低0.47元/天 解锁文章
5620

被折叠的 条评论
为什么被折叠?



