一、正则式(regular expression)
1.正则式定义:
ε表示语言{ ε},a表示语言{a},(r)|(s)表示语言L(r)并L(s),(r)(s)表示语言L(r)L(s),(r)*表示语言(L(r))*
正则式优先级为 闭包>连接>或,即((a)(b)*)|(c)写为ab*|c 。
再给一些例子:(a|b)(a|b)定义的语言为{aa,ab,ba,bb},(a|b)*定义为由a和b表示的所有串集。
2.C语言标识符的正则定义:
letter_ → A|B|...|Z|a|b|...|z|_
digit → 0|1|...|9
id → letter_(letter_ | digit)*
3.正则式和上下文无关文法比较:
任何正则式都可写出上下文无关文法(更准确地说为正规文法,即3型文法)。

本文介绍了词法分析的基本概念,包括正则式的定义及其优先级,C语言标识符的正则定义。接着,讨论了有限自动机,特别是非确定有限自动机(NFA)和确定有限自动机(DFA),以及如何将NFA转换为DFA。通过实例展示了如何构造和转换正则表达式对应的自动机,并给出了正规文法的构造过程。
最低0.47元/天 解锁文章
2205

被折叠的 条评论
为什么被折叠?



