前端 指的是编译器对程序代码的分析和理解过程,
后端: 生成目标代码的过程
词法分析:
语法是由一个个token组成的,我们可以制定一些来区分每一个token,比如对于>
, 既可能表示是表示GT,也可能表示的是GE
这些规则也可以由词法分析器的生成工具来生成, 这些生成工具是基于一些规则来work的。
这些规则用正则文法来表达,符合正则文法的表达式称之为正则表达式, 生成工具可以读入正则表达式,生成一种叫,"有限自动机"的算法
有限自动机是有限个状态的自动机,当达到某个状态的时候,就会做某件事情,比如当你写了一个标识符,
语法分析
编译器的下一个阶段是语法分析,语法分析是在词法分析的基础上面识别出程序的语法结构,这个结构就是一个树状结构,是计算机容易理解和执行的。
这棵树叫做抽象语法树, AST,树木的每一个节点是一个语法单元, 形成ast之后的好处就是,让计算机很容易去处理,一种非常直观的构造思路是自上而下进行分析。
首先构造根节点,代表整个程序,之后向下扫描 Token 串,构建它的子节点, 当它看到一个 int 类型的 Token 时