正则文法与有限自动机的等价转换及可控性分析
1. 正则文法与有限自动机的等价转换
1.1 相关研究概述
在正则表达式、正则文法和非确定有限自动机的研究中,等价性和包含性问题是重要的研究方向。这些问题的复杂度分析表明,在多带确定性图灵机上,等价性和包含性问题所需时间超过线性时间,且其复杂度“本质上”与所表示语言的结构无关。不过,也有一些研究取得了重要成果:
- Stearns 和 Hunt :证明了对于无歧义的正则表达式、正则文法和有限自动机的等价性和包含性问题,依赖于高度无歧义的表达式、文法和自动机是固有的,并给出了确定性多项式时间算法,还将算法扩展到歧义受固定 k 限制的情况。
- Laurikari :对传统非确定有限自动机(NFAs)进行保守扩展,通过给转换添加“标签”来跟踪输入字符串中所选转换的最后使用位置,得到的自动机类似于非确定米利机,并给出了将这些增强自动机转换为相应确定自动机的算法,可高效处理字符串。
- Allauzen 等人 :提出了通用加权文法软件库 GRM Library,可用于文本、语音和生物序列处理等多种应用,其底层算法支持多种半环以及数亿条规则或转换的大型文法和自动机的表示和使用。
- Hunt :对正则表达式问题的计算复杂度进行了观察,指出等价性和包含性问题在多带确定性图灵机上需要超过线性时间,还给出了正则文法的子类,这些子类能生成所有正则集,且其等价性和包含性在多项式时间内可确定性判定。
- Brüggemann - Klein
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



