1.1 编译器概述

原创已于 2024-01-30 23:32:58 修改 · 1.7k 阅读

·

21

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2024-01-30 23:27:46 首次发布

程序猿之编译原理专栏收录该内容

62 篇文章

订阅专栏

部署运行你感兴趣的模型镜像

思维导图:

第1章：编译原理概述

1. 编译器的基本概念

定义: 编译器是一种翻译器，它将高级语言（源语言）编写的程序转换成低级的机器语言（目标语言）。
组成: 编译器由多个阶段组成，每个阶段将源程序从一种表示变换为另一种。
知识涉及: 编程语言、计算机体系结构、形式语言理论、类型论、算法和软件工程。

1.1 编译器的工作阶段

词法分析:
- 功能：将字符流组织成词法记号流。
- 输出：记号流，如 (id,1), (=), (id,2), (+), (id,3), (*), (60) 等。
- 特点：删除分隔单词的空格，区分词法单元的类型和属性。
词法单元的属性:
- 标识符在符号表中的条目，例如 position, initial, rate。
- 符号表存储标识符的属性，如名字和类型。

图1.1 编译各阶段示意

各阶段:
- 词法分析器 → 语法分析器 → 语义分析器 → 中间代码生成器 → 代码生成器。
- 每个阶段都对程序进行进一步的转换和优化。

1.2 词法分析的进一步讨论

词法分析也称线性分析或扫描。
重点在于将源代码字符流转换成记号流，为后续分析做准备。

1.1.2 语法分析

定义和功能

语法分析（Syntax Analysis）：也称为分析（Parsing），其主要目的是检查由词法分析输出的记号流是否符合编程语言的语法规则。
作用：根据语言的语法规则建立程序的层次结构，如函数、语句、表达式等。

中间表示：语法树

构建语法树：使用词法记号的第一元素（例如标识符）来构建一种树形的中间表示。
语法树特点：
- 内部节点：表示运算。
- 子节点：代表运算的操作对象。
应用：编译器后续阶段使用语法树来进一步分析源程序和生成目标代码。

语法分析的深入讨论

专门章节：第3章将专门讨论语法分析算法。
语法树的详细讨论：第4章将详细讨论编译器如何利用输入的层次结构产生语法树。

图1.2 示例

语法树实例：展示了记号流构建的语法树示例，包括类型转换的插入（如int到float）。

1.1.3 语义分析

目的和作用

定义: 语义分析阶段主要使用语法树和符号表中的信息来检查源程序各部分之间的语义一致性。
功能:
- 确保程序各部分能有意义地结合。
- 收集并保存类型信息到符号表或语法树中。

类型检查

重要组成: 类型检查是语义分析的一个重要部分。
操作: 检查每个运算符的操作对象类型是否适当。
错误报告: 如实数作为数组下标，编译器需报告错误。
类型转换: 某些情况下，编译器会执行隐式类型转换，例如将整数转换为实数。

示例说明

例子: 在机器内部，整数和实数的二进制表示不同，即使值相同。
类型检查实例: 对于图1.2中的算式，编译器会发现'*'运算符作用于实型变量rate和整数60，将引入额外的算符节点inttofloat进行类型转换。

深入讨论

详细讨论: 类型检查和语义分析的详细讨论将在第5章进行。

1.1.4 中间代码生成

目的和过程

定义: 中间代码生成是编译过程的一个阶段，发生在语法分析和语义分析之后。
作用: 产生源程序的低级显式中间表示，类似于抽象机的程序。
特性: 中间表示应易于产生并且易于转换成目标程序。

中间表示形式

三地址代码: 第7章主要采用三地址代码作为中间表示。
- 结构：类似抽象机器的汇编语言，每条指令最多有三个操作数。
- 例子：示例语句 (1.1) 的三地址代码转换。

中间代码的特点

单算符指令: 除赋值算符外，每条指令最多有一个算符，编译器确定运算顺序。
临时变量: 生成临时变量名以保存指令的计算结果。
变量操作数数目: 某些三地址指令的操作数少于三个。

深入讨论和应用

章节讨论: 第7章详细描述主要中间表示形式。
额外功能: 中间表示除计算表达式外还包括条件控制转移、无条件控制转移和过程调用。
算法提供: 第4章和第7章提供了为编程语言典型构造产生中间代码的算法。

1.1.5 代码优化

目的和定义

代码优化: 代码优化阶段旨在改进中间代码，以生成更高效的目标代码。
优化目标: 主要目标是提高执行速度，但也可能包括减少代码长度或降低能耗。

代码优化的机会

中间代码的生成: 简单的中间代码生成算法为代码优化提供了更多机会。
例子: 通过简单的中间代码生成方法产生的代码可以在优化阶段得到改进。

优化策略和实例

类型转换优化: 如将整数转换为浮点数的操作可在编译时完成。
临时变量优化: 例如，如果临时变量只被引用一次，可以直接使用其值。
优化结果示例: 显示了优化后的代码如何变得更简洁高效。

优化编译器

定义: 能完成大量优化的编译器称为优化编译器。
时间消耗: 优化编译器在优化上消耗的时间可观，但可以显著减少目标程序的运行时间。

深入讨论和应用

章节讨论:
- 第9章和第10章分别讨论独立于机器和依赖于机器的优化。
- 第8章在讨论代码生成时也会涉及代码优化。

1.1.6 代码生成和寄存器分配

代码生成的定义和目的

代码生成: 代码生成是将源程序的中间表示转换为目标语言的过程。
目标语言: 目标语言可以是机器语言，其中涉及寄存器或内存单元的分配。

寄存器分配的重要性

关键问题: 代码生成阶段的一个核心问题是寄存器的分配。
目的: 高效地使用寄存器可以优化程序执行速度和资源使用。

示例和操作

寄存器使用示例: 以使用寄存器 R1 和 R2 来转换中间代码的例子。
指令序列:
- 转换中间代码为机器指令序列。
- 如何将操作数和目的操作数映射到寄存器。
指令类型:
- 表示常量、地址内容等的不同指令。

转换过程

过程描述: 如何将中间代码的操作转换为机器指令。
详细操作:
- 指令如何处理变量和常量。
- 寄存器如何存取和操作数据。

进一步讨论

章节讨论: 变量在寄存器中的分配和管理将在后续章节中详细讨论。

1.1.7 符号表管理

符号表的作用

定义: 符号表是编译器用来记录源程序中使用的所有变量名和相关信息的数据结构。
内容: 包括变量名、数据类型、作用域、存储位置、参数信息等。

符号表的重要性

变量信息记录: 记录每个变量的属性，例如数据类型和作用域。
函数信息记录: 对于函数名，还记录参数个数、每个参数的类型、参数传递方式和返回值类型。

符号表的应用

编译过程: 在编译过程中，当读入一个新名字时，会将其记录到符号表，并在后续编译过程中使用。
快速访问: 使编译器能快速检索和管理变量名及其属性。

符号表的讨论

章节讨论: 符号表的详细讨论将在第7章进行。

编译过程示例

图1.3总结: 展示了语句 (1.1) 的完整编译过程，包括从词法分析到代码生成的各个阶段以及符号表的使用。

1.1.8 编译器的阶段分组

编译器的逻辑分阶段

逻辑阶段: 编译器从逻辑上被分为7个阶段。

分析与综合两大部分

分析部分（前端）:
- 功能：揭示源程序的基本元素及其层次结构，确定它们的含义，建立源程序的中间表示。
- 常见活动：词法分析、语法分析、语义分析等。
综合部分（后端）:
- 功能：根据中间表示生成与源程序等价的目标程序。
- 包括：代码优化和目标代码生成。

阶段的组合和实现

一遍扫描: 多个阶段的活动可以通过一次扫描（pass）实现，包括读输入文件和写输出文件。
实例:
- 前端的各阶段可以组成一次扫描。
- 独立于机器的代码优化可以是单独的一遍。
- 针对特定机器的代码生成作为后端遍。

前端和后端的重用与修改

重用和修改: 重写编译器的后端以产生同一源语言在不同机器上的编译器是常见的。
设计考虑: 如果后端设计得当，通常不需要大量重新设计。
不同语言的统一编译: 将不同的源语言编译成同一种中间表示，使用同一个后端，从而在一种机器上支持不同的源语言。

1.1.9 解释器

解释器与编译器的区别

主要区别: 解释器直接执行源程序指定的运算，而不是像编译器那样生成目标程序。
相似性: 解释器也进行词法分析、语法分析和语义分析，以理解源程序的运算。

解释执行的效率

效率比较: 解释执行的效率通常低于编译器生成的机器代码。
原因: 每次执行源程序的某个语句时，都需要重新进行词法、语法和语义分析。

解释器的中间语言

目的: 寻找适合于解释的中间语言，以减少对源程序的反复分析时间。
历史演变:
- 20世纪80年代BASIC：解释器将源程序翻译成中间语言，然后执行中间语言程序。
- Java时代：
  - 编译器：将Java程序翻译成字节码（一种中间语言）。
  - 解释器：对字节码进行解释执行。

解释器的功能演变

早期解释器: 编译和解释功能合并在一个程序中。
现代解释器: 功能分离，编译和解释由两个不同的程序完成。

您可能感兴趣的与本文相关的镜像

Seed-Coder-8B-Base

Seed-Coder-8B-Base

文本生成

Seed-Coder

Seed-Coder是一个功能强大、透明、参数高效的 8B 级开源代码模型系列，包括基础变体、指导变体和推理变体，由字节团队开源

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

夏驰和徐策 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。