基于随机博弈模型检查的自适应分析
1. 策略合成
策略合成是为玩家 sys 在博弈 G 中生成一个无记忆的确定性策略,以优化其目标函数。该策略合成的目标规范以 rPATL 属性的形式给出,分别使用运算符 P▷◁q 或 Rr▷◁x 来优化概率或奖励。
- 基于概率的属性 :用于最大化满足给定属性的概率(或相反,最小化属性违反的概率)。其编码模式为: ⟨⟨sys⟩⟩P▷◁∈{max=?,min=?}[F φ] 。例如, ⟨⟨sys⟩⟩Pmax=?[F success] 表示“无论环境采用何种策略,系统玩家能够保证达到成功状态的最大概率值”。
- 基于奖励的属性 :有助于最大化系统运行所获得的收益(例如,效用方面),或最小化某些成本(例如,在适应系统时最小化实现特定结果的时间)。其编码模式为: ⟨⟨sys⟩⟩Rr▷◁∈{max=?,min=?}[F⋆φ] 。例如, ⟨⟨sys⟩⟩Rutilitymax=?[Fc empty batt] 表示“无论环境采用何种策略,系统在电池完全耗尽之前能够保证获得的最大累积效用奖励值”; ⟨⟨sys⟩⟩Rtimemin=?[Fc rt < MAX RT] 表示“无论环境采用何种策略,系统能够保证达到响应时间 rt 低于阈值 MAX RT 的可接受性能水平的最小时间值”
超级会员免费看
订阅专栏 解锁全文
864

被折叠的 条评论
为什么被折叠?



