目录
1. llvm基础理念
前面我们了解了LLVM的软件架构和编译链工具,接下来我们要进入llvm的实战阶段了。
首先还是介绍一下LLVM的设计理念,了解如何把C语言代码编译成LLVM IR(Intermediate Representation 中间码)以及如何把它转为其他多种形式。可以看到在LLVM的源码树中代码是如何组织的,以及如何使用LLVM自己编写一个编译器。
与其他编译器(如GCC)不同,LLVM的设计目标是成为一系列的库。本文将以LLVM优化器(optimizer)为例来解释这个概念,因为它的设计就是基于库的。它允许自定义选择各个Pass(遍)的执行顺序,也能够自定义选择哪些优化Pass——也就是说,有一些优化对目前的系统是没有帮助的,只有部分优化会针对目前系统。反观传统的编译优化器,它们通常是由大量高度耦合的代码组成的,很难拆分成容易理解和使用的小模块。而在LLVM中,如果想了解特定的优化器,是不需要知道整个系统是如何工作的。只需选择一个优化器并使用它,无须担心其他依赖它的组件。
LLVM IR是基于静态单赋值(static single assignment——SSA)的,并且提供了类型安全性、底层操作性、灵活性,因此能够清楚表达绝大多数高级语言。这种表示形式贯穿LLVM编译的各个阶段。事实上,LLVM IR致力于成为一种足够底层的通用IR,只有这样,高级语言的诸多特性才能得到实现。同样,LLVM IR组织良好,也具备不错的可读性。SSA于1980年由IBM开始研究,由于它的一些良好性质,之后在编译器领域得到广泛应用,包括LLVM。
2. 准备工作
在开始之前,我们需要在本机安装LLVM的工具链,特别是opt工具(工具链文章的链接)