【论文精读】时序逻辑推理之高效的参数学习 Efficient Parametric Identification for STL

前言:由于上一篇文章Parametric Identification of Temporal Properties中的算法效率复杂度过高,因此找到了这一篇文献看看是否有更高效的算法.

主要参考文献:
Alexey Bakhirkin, Thomas Ferrère, and Oded Maler. 2018. Efficient Parametric Identification for STL. In Proceedings of the 21st International Conference on Hybrid Systems: Computation and Control (part of CPS Week) (HSCC '18). Association for Computing Machinery, New York, NY, USA, 177–186. DOI:https://doi.org/10.1145/3178126.3178132

概览

此文是在前文基础上的改进,同样给定公式模板,寻找满足信号公式参数的取值范围。

流水账笔记

1 Introduction

介绍了STL的应用背景,提到STL的主要应用场景是监督。这里又cue了上一篇文献的工作。本文引入了satisfaction signal, robustness signal 和 parametric validity signal,这些名词具体是什么还得接着往下看。这里先mark一下原文:

The major contribution of the paper is a new procedure to compute validity domains that follows the computation of satisfaction and robustness signals by propagating them as function of time, from sub-formulas to formulas. With each formula φ \varphi φ and a signal w w w we associate a parametric validity signal whose value at t t t indicates the set of parameter valuations v v v such that ( w , t ) ⊨ φ [ v ] (w,t)\models\varphi[v] (w,t)φ[v].

2 Parametric Signal Temporal Logic

这里提到STL可以描述布尔信号和实数信号的特性,这里可以将布尔信号看作取值为0或1的实数信号,所以这里不将两种信号加以区分。

PSTL/极性/可行域等相关介绍同上一篇文献

算子 “ ⋄ \diamond ” & “ □ \square

因为我老是分不清eventually和always的两个符号,所以这里记一下:
e v e n t u a l l y : ⋄ ⋄ φ ≡ t r u e   U φ a l w a y s : □ □ φ ≡ ¬ ⋄ ¬ φ eventually:\diamond \\ \diamond \varphi \equiv true\ \mathcal{U}\varphi \\ always: \square \\ \square \varphi \equiv \neg \diamond \neg \varphi eventually:φtrue Uφalways:φ¬¬φ

算子 “ U \mathcal{U} U” & “ R \mathcal{R} R

φ   U [ a , ∞ ) ψ ≡ □ [ 0 , a ] ( φ   U ψ ) φ   U [ a , b ] ψ ≡ ( ⋄ [ a , b ] ψ ) ∧ ( φ   U [ a , ∞ ] ψ ) ≡ ( ⋄ [ a , b ] ψ ) ∧ ( □ [ 0 , a ] ( φ   U ψ ) ) \varphi \ \mathcal{U}_{[a,\infty)}\psi \equiv \square_{[0,a]}(\varphi\ \mathcal{U} \psi)\\ \varphi \ \mathcal{U}_{[a,b]}\psi \equiv (\diamond_{[a,b]}\psi)\land(\varphi\ \mathcal{U}_{[a,\infty]}\psi) \equiv (\diamond_{[a,b]}\psi)\land (\square_{[0,a]}(\varphi\ \mathcal{U} \psi)) φ U[a,)ψ[0,a](φ Uψ)φ U[a,b]ψ([a,b]ψ)(φ U[a,]ψ)([a,b]ψ)([0,a](φ Uψ))

上面的式子这么理解:信号至少满足 φ \varphi φ a时间后满足 ψ \psi ψ,之后的状态概不负责。

下面的式子这么理解:信号至少持续满足 φ \varphi φ要求a时间,最长持续满足 φ \varphi φ要求b时间后满足要求 ψ \psi ψ,之后的状态概不负责。

接下来介绍与until互补的概念,R代表Release,和Until算子形成互补的含义。
φ R ψ ≡ ¬ ( ¬ φ U ¬ ψ ) \varphi \mathcal{R} \psi \equiv \neg(\neg \varphi \mathcal{U}\neg\psi) φRψ¬(¬φU¬ψ)
这里这样理解:信号一旦满足 φ \varphi φ,之后就会持续满足 ψ \psi ψ.

Parametric Validity Signal

这里是本文的一个新概念,我这里把它翻译为可行域函数(信号),指的是从时间t之后的信号序列 w [ t ] w[t] w[t](后缀)对应的参数可行域。总的可行域 D ( φ , w ) D(\varphi,w) D(φ,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值