【软件设计师】——编译原理

本文详细介绍了编译系统中的关键步骤,包括词法分析(扫描和转换)、语法分析(构造语法树)、语义分析(检查类型和作用域)、中间代码生成(如三地址码)以及目标代码生成和优化。讨论了文法中的终结符、非终结符、产生式和文法分类。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


编译系统的结构

词法分析/扫描(Scanning)

从左向右逐行扫描源程序的字符,识别出各个单词,确定 单词的类型 。将识别出的单词转换成统一的 机内表示 , 词法单元(token)形式:

token:<种别码, 属性值>
单词类型种别种别码
关键字program, if , else…一词一码
标识符变量名,数组名,记录名…多词一码
常量整型,浮点型,字符型…一型一码
运算符算术、关系、逻辑一词\一型一码
界限符; ( ) = { } …一词一码

语法分析( parsing)

语法分析器 (parsing) 从此法分析器输出的token序列中 识别出各类短语 ,并构造语法分析树

position = initial + rate * 6;
<id, position> <=> <id,initial> <+> <id, rate> <*> <num,60><;>

语义分析

  • 收集标识符的属性信息

    • 种属 (kind)

    • 类型 (type)

    • 存储位置,长度

    • 作用域

    • 参数和返回值信息

  • 语义检查

    • 变量或过程未经声明就使用
    • 变量或过程名重复声明
    • 运算分量类型不匹配
    • 操作符与操作数之间的类型不匹配
      • 数组下标不是证书
      • 对非数组变量使用数组访问操作符
      • 对非过程名使用过程调用操作符
      • 过程调用的参数类型或数目不匹配
      • 函数返回类型不匹配

中间代码生成

  • 三地址码 (Three-address Code)
    • 三地址码由类似汇编语言的指令序列组成,每个指令最多有三个操作数
  • 语法结构树/语法树 (Syntax Trees)

目标代码生成

  • 目标代码生成以源程序的中间表示形式作为输入,并把它映射到目标语言
  • 目标代码生成的一个重要人物是为程序中使用的变量 合理分配寄存器

代码优化

  • 为改进代码所进行的 等价程序变换 ,使其 运行得更快占用空间更少

语言和文法

字母表(Alphabet)

  • 字母表 Σ \Sigma Σ 是一个有穷符号集合
  • 字母表的 乘积 Σ 1 Σ 2 = { a b ∣ a ∈ Σ 1 , b ∈ Σ 2 } \Sigma_1 \Sigma_2 = \{ab|a\in\Sigma_1,b\in \Sigma_2\} Σ1Σ2={abaΣ1,bΣ2}
  • 字母表的 n次幂 : Σ n = Σ n − 1 Σ \Sigma^n = \Sigma^{n-1}\Sigma Σn=Σn1Σ
  • 字母表的 正闭包 : Σ + = Σ 1 U Σ 2 U Σ 3 . . . \Sigma^+ = \Sigma^1U\Sigma^2U\Sigma^3... Σ+=Σ1UΣ2UΣ3...
  • 字母表的 克林闭包 : Σ ∗ = Σ 0 U Σ + \Sigma^* = \Sigma^0 U \Sigma^+ Σ=Σ0UΣ+

串(String)

  • 串是字母表中 符号的 一个 有穷序列
  • 串s的 长度 通常记作 |s| ,指其中符号的个数
  • 空串 是长度为0的串,用 ϵ \epsilon ϵ 表示
  • 串的连接 : x = dog , y= house , xy = doghouse
  • 串的幂运算 :若s = ba, 有 s 1 = b a , s 2 = b a b a , s 3 = b a b a b a . . . s^1=ba, s^2=baba, s^3=bababa... s1=ba,s2=baba,s3=bababa...

文法

G = ( V T , V N , P , S ) G=(V_T,V_N,P,S) G=(VT,VN,P,S)

  • V T : V_T: VT 终结符集合 , 终结符(terminal symbol) 是文法所定义的语言的 基本符号 ,有时也称为token

  • V N : V_N: VN 非终结符集合 ,非终结符(nonterminal) 是用来表示语法成分的符号,也称语法变量

  • P : P: P 产生式集合,产生式(production) 描述了将终结符和非终结符组合成串的方法

    • 一般形式: α \alpha α-> β \beta β
    • 产生式的简写:对一组有相同 左部 的产生式可以简记为: α \alpha α -> β 1 ∣ β 2 ∣ β 3 . . . \beta_1 | \beta_2 | \beta_3... β1β2β3... ,右部可称为 α \alpha α候选式
  • S : S: S 开始符号

  • 推导(Derivations)和归约(Reductions)

    • 推导: 用产生式的左部替换产生式的左部
    • 归约: 推导的逆运算
  • 文法分类:

    • 0型文法: 无限制文法,左部至少包含一个非终结符
    • 1型文法: 上下文有关文法,左部符号的个数不准多于右部符号。不包含空产生式
    • 2型文法: 上下文无关文法,左部不能出现终结符
    • 3型文法: 正则文法(RG)
      • 右线性文法: A A A-> w B w B wB A A A-> w w w
      • 左线性文法: A A A-> B w B w Bw A A A-> w w w
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

栉风沐雪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值