无有效负载感知的网络攻击检测的局限性
1. 动态规划示例与贝叶斯规则应用
在库存管理问题中,我们可以借助动态规划(DP)来制定最优策略。以一个为期 N 天的商店货架库存问题为例,系统状态由每天开始时货架上某商品的数量 (x_k) 表示。每天破晓时会补充 (u_k) 单位的货物,而当天该商品的需求 (w_k) 是随机的,且 (w_k) 和 (u_k) 均为非负。系统的状态转移方程为:
[x_{k + 1} = \max(0, x_k + u_k - w_k)]
假设货架上的库存上限为 2 单位,超出库存的需求将导致业务损失。每天的存储成本为 ((x_k + u_k - w_k)^2),这意味着无论是业务损失还是当天结束时的过量库存都会产生惩罚。假设商店每单位库存的采购成本为 1,那么每天的运营成本为:
[g_k(x_k, u_k, w_k) = u_k + (x_k + u_k - w_k)^2]
N 天结束时的终端成本假设为 0。若规划期 N 为 3 天,初始库存 (x_0 = 0),且三天的需求 (w_k) 具有相同的概率分布:
- (p(w_k = 0) = 0.1)
- (p(w_k = 1) = 0.7)
- (p(w_k = 2) = 0.2)
问题的目标是确定最优的补货策略,以最小化总运营成本。该问题的 DP 算法为:
[J_k(x_k) = \min_{0\leq u_k\leq 2 - x_k, u_k = 0, 1, 2} E_{w_k}[u_k + (x_k + u_k - w_k)^2 + J_{k + 1}(x_{k + 1})]]
其中 (k = 0, 1, 2),(x_k)、(u_k
超级会员免费看
订阅专栏 解锁全文
1934

被折叠的 条评论
为什么被折叠?



