43、简单语法的概率泛化及其在强化学习中的应用

简单语法的概率泛化及其在强化学习中的应用

1. 可逆简单语法(RSG)的不可统一性

首先考虑有限语言 (L = (a|b)(c|d)(e|f) = {ace, acf, ade, adf, bce, bcf, bde, bdf})。在规范形式下,生成 (L) 的任何 RSG 等价于以下两种形式之一:
- (G = \langle V, \Sigma, R, S\rangle),规则为 ({S \to aA|bB, A \to cC|dD, B \to cC|dD, C \to e|f, D \to e|f})
- (H = \langle V’, \Sigma, R’, S\rangle),规则为 ({S \to aA_0A_1|bB_0B_1, A_0 \to c|d, B_0 \to c|d, A_1 \to e|f, B_1 \to e|f})

通过分析推导过程,可知 (K(G) \not\subset K(H)) 且 (K(H) \not\subset K(G))。根据相关引理,不存在 RSG (I) 使得 (L(I) = L),同时 (K(G) \subset K(I)) 且 (K(H) \subset K(I)),这表明 RSG 类是不可统一的。

2. 可统一简单语法(USG)的定义与性质

为了解决 RSG 的不可统一问题,引入了可统一简单语法(USG)的概念。
- 相关定义
- 对于 SG (G = \langle V, \Sigma, R, S\rangle),定义 (\sigma_G(A) = {a \in \Sigma | A \to a\alpha \i

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值