CIL:用于C程序分析和转换的中间语言及工具
1. 引言
C编程语言以其处理底层结构的灵活性而闻名,但无论是人类还是自动化工具,都难以理解和分析它。在分析和检测C程序以确保指针安全使用的项目中,现有的C中间语言和前端工具都无法满足所有需求。有些工具级别过高,无法支持详细分析;有些则级别过低,专为编译器设计;还有些无法处理GCC扩展,导致无法用于使用这些扩展的软件,如Linux设备驱动程序和内核。
例如下面的C代码片段:
1 struct { int *fld; } *str1;
2 struct { int fld[5]; } str2[4];
3 str1[1].fld[2];
4 str2[1].fld[2];
第3行和第4行语法相同,但含义不同。第3行涉及三次内存引用,而第4行仅涉及一次。低级别表示虽然没有这种歧义,但通常会丢失类型、循环等高级结构的信息,且难以以忠实于原始源代码的方式输出。因此,目标是找到一种折中的方法。
CIL(C Intermediate Language)是一种高度结构化的“干净”C子集,满足易于分析、接近源代码且能处理实际代码的要求。它减少了语法和概念形式的数量,例如将所有循环结构简化为单一形式,为所有函数体添加显式返回语句,并消除了“->”等语法糖。CIL还将类型声明与代码分离,使类型提升显式化,并在函数体内扁平化作用域。此外,CIL支持除嵌套函数外的所有GCC和MSVC扩展,能够处理整个Linux内核。
2. 左值处理
左值是指引用存储区域的表达式,只有左值才能出现在赋值语句的左侧。在C