4、单词自动机与时间粒度:从理论到实践

单词自动机与时间粒度:从理论到实践

1. 单字符串自动机与时间粒度表示

在时间粒度的表示中,单字符串自动机(SSA)起着重要作用。对于两个识别最终周期性单词 ( w_1 = u_1 v_1^{\omega} ) 和 ( w_2 = u_2 v_2^{\omega} ) 的 SSA ( A_1 ) 和 ( A_2 ),当且仅当两个粒度规范 ( (u_1, v_1) ) 和 ( (u_2, v_2) ) 等价时,才有 ( w_1 = w_2 )。例如,图 2.4 展示了一个表示《商业周刊》时间粒度的 SSA。

然而,基于自动机和基于字符串的方法存在一个主要局限性,即当要表示的粒度具有长初始模式和/或长重复模式时,会产生冗长的表示。以闰年为例,每 400 年重复一次相同的模式,因此用天数表示公历年份(或月份)的任何粒度规范/SSA 的大小必然大于 ( 10^5 )。此外,涉及这些冗长时间粒度表示的计算可能会变得相当昂贵。

2. 计数器单字符串自动机(CSSA)

为了紧凑地编码时间结构的冗余信息,引入了计数器和多重转换,从而扩展和改进了基于自动机的方法。这里区分了两种转换:主转换和次转换。在计算的任何时刻,根据适当的激活规则,最多选择一个(主或次)转换,该规则考虑计数器的值。默认规则是:只要次转换可用,就选择次转换;否则,选择主转换。

计数器单字符串自动机(CSSA)定义为一个元组 ( A = (A, I, S, \delta, \gamma, s_0, c_0) ),其中:
- ( A ) 是有限字母表。
- ( I ) 是有限的计数器集合,通常用 ( i, j, k, \cdots ) 表示,其取值属于从 ( I ) 到

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值