马尔可夫信息价格相关研究解读
1. 核心定理与推论
定理1表明,对于半可加目标函数 val ,若在自由信息世界中,针对某些打包约束 F 的效用最大化(Util - Max)问题存在一个α近似的节俭算法,那么在马尔可夫信息价格(Markovian PoI)世界中,对应效用最大化问题也存在一个α近似策略。对于效用最小化(Disutil - Min)问题,也有类似结果。
基于已知的节俭算法,有以下推论:
|问题类型|具体问题|近似情况|
| ---- | ---- | ---- |
|Util - Max和Disutil - Min|拟阵问题|存在最优算法|
|Util - Max|匹配问题|2近似|
|Util - Max|k系统问题|k近似|
|Disutil - Min|集合覆盖问题|min{θ, log n}近似,其中θ是元素所在集合的最大数量|
|Disutil - Min|设施选址问题|1.861近似|
|Disutil - Min|带奖励的斯坦纳树问题|3近似|
2. 状态等级的定义
在证明定理1之前,需要定义马尔可夫系统中每个状态的等级。考虑马尔可夫系统 S = (V, P, s, T, π, r) ,为定义状态 v ∈ V 的等级 τ v ,引入了τ惩罚的马尔可夫游戏 S(τ) 。在这个游戏中,玩家在每一步有两个选择:
- 停止 :立即结束游
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



