31、马尔可夫信息价格相关研究解读

马尔可夫信息价格相关研究解读

1. 核心定理与推论

定理1表明,对于半可加目标函数 val ,若在自由信息世界中,针对某些打包约束 F 的效用最大化(Util - Max)问题存在一个α近似的节俭算法,那么在马尔可夫信息价格(Markovian PoI)世界中,对应效用最大化问题也存在一个α近似策略。对于效用最小化(Disutil - Min)问题,也有类似结果。

基于已知的节俭算法,有以下推论:
|问题类型|具体问题|近似情况|
| ---- | ---- | ---- |
|Util - Max和Disutil - Min|拟阵问题|存在最优算法|
|Util - Max|匹配问题|2近似|
|Util - Max|k系统问题|k近似|
|Disutil - Min|集合覆盖问题|min{θ, log n}近似,其中θ是元素所在集合的最大数量|
|Disutil - Min|设施选址问题|1.861近似|
|Disutil - Min|带奖励的斯坦纳树问题|3近似|

2. 状态等级的定义

在证明定理1之前,需要定义马尔可夫系统中每个状态的等级。考虑马尔可夫系统 S = (V, P, s, T, π, r) ,为定义状态 v ∈ V 的等级 τ v ,引入了τ惩罚的马尔可夫游戏 S(τ) 。在这个游戏中,玩家在每一步有两个选择:
- 停止 :立即结束游

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值