序贯抽样与最优策略解析
序贯抽样基础
序贯抽样是一种在抽样过程中根据已有的样本信息动态决定是否继续抽样的方法。我们先从计算期望步数开始,对于给定条件 (n \leq n^ ),期望步数 (E_{\xi}(n | n \leq n^ ) = E_{\xi}(n | \theta = \theta_1)) 可通过以下公式计算:
[E_{\xi}(n | \theta = \theta_1) = \sum_{t = 1}^{n^ } t P_{\xi}(n = t | \theta = \theta_1) = \sum_{t = 1}^{n^ - 1} t\gamma^{t - 1}(1 - \gamma) + n^ \gamma^{n^ - 1} = \frac{1 - \gamma^{n^ }}{1 - \gamma}]
这里使用了几何级数的公式。该过程的价值 (\overline{V}(n^ )) 可表示为:
[\overline{V}(n^ ) = E_{\xi}(U | n = n^ ) P_{\xi}(n = n^ ) + E_{\xi}(U | n < n^ ) P_{\xi}(n < n^ ) = \xi b\gamma^{n^ } - c E_{\xi}(n)]
进一步推导可得:
[\overline{V}(n^*) = \frac{c}{\gamma - 1} + \frac{c}{\log \gamma} \left[1 + \frac{c}{\xi b(1 - \gamma)}\right
超级会员免费看
订阅专栏 解锁全文
954

被折叠的 条评论
为什么被折叠?



