22、基于随机博弈模型检查的自适应分析

基于随机博弈模型检查的自适应分析

1. 策略合成

策略合成是为玩家 sys 在博弈 G 中生成一个无记忆的确定性策略,以优化其目标函数。该策略合成的目标规范以 rPATL 属性的形式给出,分别使用运算符 P▷◁q Rr▷◁x 来优化概率或奖励。
- 基于概率的属性 :用于最大化满足给定属性的概率(或相反,最小化属性违反的概率)。其编码模式为: ⟨⟨sys⟩⟩P▷◁∈{max=?,min=?}[F φ] 。例如, ⟨⟨sys⟩⟩Pmax=?[F success] 表示“无论环境采用何种策略,系统玩家能够保证达到成功状态的最大概率值”。
- 基于奖励的属性 :有助于最大化系统运行所获得的收益(例如,效用方面),或最小化某些成本(例如,在适应系统时最小化实现特定结果的时间)。其编码模式为: ⟨⟨sys⟩⟩Rr▷◁∈{max=?,min=?}[F⋆φ] 。例如, ⟨⟨sys⟩⟩Rutilitymax=?[Fc empty batt] 表示“无论环境采用何种策略,系统在电池完全耗尽之前能够保证获得的最大累积效用奖励值”; ⟨⟨sys⟩⟩Rtimemin=?[Fc rt < MAX RT] 表示“无论环境采用何种策略,系统能够保证达到响应时间 rt 低于阈值 MAX RT 的可接受性能水平的最小时间值”

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值