马尔可夫系统与有效扰动函数的研究
在优化和决策领域,马尔可夫系统和有效扰动函数的研究有着重要的地位。下面将详细介绍相关的理论和算法。
马尔可夫系统的线性规划问题
在马尔可夫系统的研究中,存在一组线性规划约束。前四个约束描述了马尔可夫系统推进的动态过程,第五个约束编码了打包约束 (F)。我们将这个线性规划(LP)的最优解记为 ((x, y, z))。对于一些打包约束,比如拟阵、匹配和 (k) 个拟阵的交集,我们可以高效地求解上述线性规划。
当我们将变量 (y_{u}^i)、(x_i) 和 (z_{u}^i) 解释为无承诺情况下最优策略对应的概率时,它们构成了线性规划的一个可行解。这就引出了下面的引理:
- 引理 3 :无承诺情况下的最优效用至多为线性规划的值。
使用 OCRS 对线性规划进行舍入
在介绍舍入算法之前,我们需要了解在线竞争解决方案(OCRS)的概念。
- OCRS 定义 :给定一个点 (x \in P_F),令 (R(x)) 表示一个随机集合,其中每个元素 (i) 独立地以概率 (x_i) 包含在集合中。元素 (i) 逐个揭示是否属于 (R(x)),我们需要在揭示下一个元素之前不可撤销地决定是否将属于 (R(x)) 的元素 (i) 选入最终解。OCRS 是一个在线算法,它选择一个子集 (I \subseteq R(x)),使得 (I \in F)。
- (\frac{1}{\alpha}) - 可选择性定义 :设 (\alpha \geq 1)。对于 (F) 的 OCRS 是 (\f
超级会员免费看
订阅专栏 解锁全文
12

被折叠的 条评论
为什么被折叠?



