lexer and parser 的java简单实现

最新推荐文章于 2025-04-21 16:05:00 发布

原创最新推荐文章于 2025-04-21 16:05:00 发布 · 2.2k 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#compiler

本文探讨了编程语言开发中词法分析与句法解析的重要性，特别是在语言规范频繁变动的初期阶段。通过分离词法与解析过程，可以提高语言开发的灵活性与效率。文章详细介绍了词法分析器与解析器的具体实现，包括识别加法与乘法中的token，并提供了基于递归下降算法的解析器示例。

A pragmatic benefit of using a dedicated upfront lexing phase is that you don’t couple the subsequent parser with lexical detail. This is useful during early programming language development, when the lexical and syntactic details are still changing frequently
使用专用的前期lexing阶段的一个实际好处是，您不会将后续解析器与词法细节相结合。这在早期编程语言开发期间很有用，因为词法和句法细节仍然经常变化。
参考

1. Lexer

github：compile/src/lexer
java实现一个词法分析器，参考link可以识别加法与乘法中的token。

token	种别码
EOI	0
SEMI（;）	1
PLUS(+)	2
TIMES(*)	3
LP( ( )	4
RP( ) )	5
NUM	6
INT	7
EQ( =)	8
ID	9

运行src/lexer
input：

int a = 1 ;
int b = a + 1;
end

output：
在这里插入图片描述

实现思路就是根据那个表，用switch…case…框架和最长匹配原则实现了词法分析。

2.parse

Grammar:

statements -> expression ;
	   | expression ; statements

expression -> term 
 	   |term + expression
  
term -> factor 
           | factor * term
 
 factor -> NUM_OR_ID
	   | LP expression RP

github：compile/src/lexer
语法太过简单，用递归下降算法可得：

input: