程序翻译环境与执行揭秘：预处理、头文件与条件编译-优快云博客

本文链接：https://blog.youkuaiyun.com/m0_59292239/article/details/127466261

文章目录

1、程序的翻译环境和执行环境
2、预处理剖析
3、头文件包含
- （1）头文件被包含的方式
- （2）嵌套文件包含

1、程序的翻译环境和执行环境

在ANSI C的任何一种实现中，存在两个不同的环境。
第1种是翻译环境，在这个环境中源代码被转换为可执行的机器指令。
第2种是执行环境，它用于实际执行代码。

（1）翻译环境

翻译环境包括4个部分：预编译阶段、编译和汇编、链接。
1、预编译阶段：是进行头文件的包含、注释的删除和#fefine符号的替换。
2、编译阶段：是把c语言代码转换成汇编代码,进行语法分析、词法分析、语义分析和符号汇总。
3、汇编阶段：把汇编指令转换成二进制指令，以及形成符号表（—_函数名+地址）。
4、链接阶段：合成段表，符号表的合并和重定位。
在这里插入图片描述

（2）运行环境

程序执行的过程：
1、程序必须载入内存中。在有操作系统的环境中：一般这个由操作系统完成。在独立的环境中，程序
的载入必须由手工安排，也可能是通过可执行代码置入只读内存来完成。
2、程序的执行便开始。接着便调用main函数。
3、开始执行程序代码。这个时候程序将使用一个运行时栈，存储函数的局部变量和返回地址。程序同时也可以使用静态内存，存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
4、终止程序。正常终止main函数；也有可能是意外终止。

（3）可执行程序产生过程

1、组成一个程序的每个源文件通过编译过程分别转换成目标代码。
2、每个目标文件由链接器捆绑在一起，形成一个单一而完整的可执行程序。
3、链接器同时也会引入标准C函数库中任何被该程序所用到的函数，而且它可以搜索程序员个人的程序库，将其需要的函数也链接到程序中。
在这里插入图片描述

2、预处理剖析

（1）预定义符号

c语言标准定义了如下五个预处理符号

FILE //进行编译的源文件
LINE //文件当前的行号
DATE //文件被编译的日期
TIME //文件被编译的时间
STDC //如果编译器遵循ANSI C，其值为1，否则未定义

#include<stdio.h>
int main()
{
	printf("file:%s line:%d time:%d\n", __FILE__, __LINE__, __TIME__ );
	return 0;
}

在这里插入图片描述

（2）define

#define标识符是c语言的一个预处理指令，凡是以#开头的均为预处理命令。语法为：#define name stuff，即#define 标识符被标识符代表的字符串。

如下：

#define MAX 10
#define reg register 为register这个关键字，创建一个简短的名字
#define do for（：：）用更形象的符号来替换一种实现
#define CASE break：case 在case语句的时候自动把break写上。
#defeine DEBUG_PRINT printf(“file:%s\tline:%d\ttime:%d\n”, \ FILE,\ LINE, TIME ) 如果定义stuff的过长，可以分成几行写，除了最后一行，每行的后面加一个反斜杠。

最后注意一点，在define定义标识符的时候，不要在最后加上 ; 容易引起语法错误。

（一）#define定义宏

1、#define 机制包括了一个规定，允许把参数替换到文本中，这种实现通常称为宏或定义宏。
2、宏的声明方式：#define name( list ) stuff，其中 list 是一个由逗号隔开的符号表，它们可能出现在stuff中。
3、这里要注意参数列表的左括号必须与name紧邻。如果两者之间有任何空白存在，参数列表就会被解释为stuff的一部分。
4、宏使用可能会出现一些问题，如下例子：

#include<stdio.h>
#define SQUARE( x ) x * x
int main()
{
	int a = 5;
	printf("%d\n", SQUARE(a + 1));
	return 0;
}

我们可能会觉得这段代码将打印36这个值。但事实不是，替换文本时，参数x被替换成a + 1,所以这条语句实际上变成了：
printf (“%d\n”,a + 1 * a + 1 ),得出结果是11。
在这里插入图片描述
在宏定义上加上两个括号，就可以解决。如图：

定义中我们使用了括号，想避免之前的问题，但是这个宏可能会出现新的错误，如下例子：

#include<stdio.h>
#define SQUARE( x ) x + x
int main()
{
	int a = 5;
	printf("%d\n", 10*SQUARE(a));
	return 0;
}

看上去，会打印100，但打印的是55.
在这里插入图片描述
因为替换之后，是printf (“%d\n”,10 * (5) + (5))，解决办法是在宏定义表达式两边加上一对括号就可以了。如图：

5、所以用于对数值表达式进行求值的宏定义都应该用这种方式加上括号，避免在使用宏时由于参数中的操作符或邻近操作符之间产生不可预料的相互作用。

（二）#define替换规则

在程序中扩展#define定义符号和宏时，需要涉及几个步骤。
1、调用宏时，首先对参数进行检查，看看是否包含任何由#define定义的符号。如果是，它们首先被替换。
2、替换文本随后被插入到程序中原来文本的位置。对于宏，参数名被他们的值所替换。
3、最后，再次对结果文件进行扫描，看看它是否包含任何由#define定义的符号。如果是，就重复上述处理过程。
还要注意一下2点：

1、宏参数和#define 定义中可以出现其他#define定义的符号。但是对于宏，不能出现递归。
2、当预处理器搜索#define定义的符号的时候，字符串常量的内容并不被搜索。

（三）带副作用的宏参数

当宏参数在宏的定义中出现超过一次的时候，如果参数带有副作用，那么你在使用这个宏的时候就可能出现危险，导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。

x+1;//不带副作用
x++;//带有副作用

#include<stdio.h>
#define MAX(a, b) ( (a) > (b) ? (a) : (b) )
int main()
{
	
	int x = 5;
	int y = 8;
	int z = MAX(x++, y++);
	printf("x=%d y=%d z=%d\n", x, y, z);
	return 0;
}

函数解析：对于x++，y++，先使用再++,先比较5和8的大小，5<8,进到b里面，此时的a是6，b是9，因为在b里面也是先使用再++，所以先使用取最大值b=9，最后的b，++变成10，综上x=6，y=10，z=9。验证如下：
在这里插入图片描述

（四）宏和函数对比

宏通常被应用于执行简单的运算，在这个宏当中#define MAX(a, b) ((a)>(b)?(a):(b))，我们使用宏而不是用函数的原因有两种：

1、用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。所以宏比函数在程序的规模和速度方面更胜一筹。
2、更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。然而这个宏怎可以适用于整形、长整型、浮点型等可以用于>来比较的类型。

宏有时候可以做函数做不到的事情。比如：宏的参数可以出现类型，但是函数做不到，比如：

#define MALLOC(num, type) (type *)malloc(num * sizeof(type))
MALLOC(10, int);//类型作为参数
//预处理器替换之后：
(int *)malloc(10 * sizeof(int));

但宏也有缺点：
1、每次使用宏的时候，一份宏定义的代码将插入到程序中。除非宏比较短，否则可能大幅度增加程序
的长度。
2、宏是没法调试的。
3、宏由于类型无关，也就不够严谨。
4、宏可能会带来运算符优先级的问题，导致程序容易出现错。正如前面所举。

（五）#和##连接符

#的使用

我们看如下代码：

#include<stdio.h>
#define PRINT(FORMAT, VALUE) printf("the value of "#VALUE "  is "FORMAT "\n", VALUE)
int main()
{
	int i = 10;
	PRINT("%d", i+3);
}

结果是：
在这里插入图片描述
这里只有当字符串作为宏参数的时候才可以把字符串放在字符串中。
而我们使用 # 预处理运算符，把一个宏参数变成对应的字符串

#include<stdio.h>
#define PRINT(FORMAT, VALUE) printf("the value of "#VALUE "  is "FORMAT "\n", VALUE)
int main()
{
	int i = 10;
	PRINT("%d", i+3);
}

在这里插入图片描述

##的使用

##是也是一种预处理运算符，用在宏定义中，在宏解析时将实际的参数进行链接。即它可以把位于它两边的符号合成一个符号。它允许宏定义从分离的文本片段创建标识符。

#include<stdio.h>
#define ADD(num, value) sum##num += value;
int main()
{
	int sum5 = 0;
	ADD(5, 10);
	printf("%d", sum5);
	return 0;
}

在这里插入图片描述

（3）#undef

#undef是一条预处理指令，这条指令用于移除一个宏定义。
如：
#undef NAME
如果现存的一个名字需要被重新定义，那么它的旧名字首先要被移除。

（4）命令行定义

许多C 的编译器提供了一种能力，允许在命令行中定义符号。用于启动编译过程。
例如：当我们根据同一个源文件要编译出一个程序的不同版本的时候，这个特性有点用处。（假定某个程序中声明了一个某个长度的数组，如果机器内存有限，我们需要一个很小的数组，但是另外一个机器内存大些，我们需要一个数组能够大些。)

#include <stdio.h>
int main()
{
  int array [SIZE];
  int i = 0;
  for(i = 0; i< SIZE; i ++)
 {
    array[i] = i;
 }
  for(i = 0; i< SIZE; i ++)
 {
    printf("%d " ,array[i]);
 }
  printf("\n" );
  return 0;
}

比如我们linux环境下输入命令行：gcc -D SIZE=10 programe.c，就可以吧SIZE改成10。

（5）条件编译

在编译一个程序的时候我们如果要将一条语句（一组语句）编译或者放弃就要使用条件编译指令。
比如说调试性的代码，删除可惜，保留又碍事，所以我们可以选择性的编译。
例如：

#include <stdio.h>
#define __DEBUG__
int main()
{
		int i = 0;
		int arr[10] = { 0 };
		for (i = 0; i<10; i++)
		{
			arr[i] = i;
         #ifdef __DEBUG__
				printf("%d\n", arr[i]);//为了观察数组是否赋值成功。
         #endif 
		}
		return 0;
}

如果 __DEBUG__定义就执行下面代码：
在这里插入图片描述
1、常见的条件编译指令：

#if 常量表达式 …
#endif //常量表达式由预处理器求值。如：
#define DEBUG 1
#if DEBUG …
#endif

2.多个分支的条件编译

#if 常量表达式 …
#elseif 常量表达式 …
#else …
#endif

3.判断是否被定义

#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol

4.嵌套指令

#if defined(OS_UNIX)
#ifdef OPTION1 unix_version_option1();
#endif
#ifdef OPTION2 unix_version_option2();
#endif
#elseif defined(OS_MSDOS)
#ifdef OPTION2 msdos_version_option2();
#endif
#endif

3、头文件包含

（1）头文件被包含的方式

1、本地文件包含，如下：

#include “filename”

查找策略：先在源文件所在目录下查找，如果该头文件未找到，编译器就像查找库函数头文件一样在标准位置查找头文件。
如果找不到就提示编译错误。
Linux环境的标准头文件的路径：

/usr/include

VS环境的标准头文件的路径：

C:\Program Files (x86)\Microsoft Visual Studio 12.0\VC\include

2、库文件包含

#include <filename.h>

查找头文件直接去标准路径下去查找，如果找不到就提示编译错误。
库文件也可以使用 “” 的形式包含，但是这样做查找的效率就低些。

（2）嵌套文件包含

如图: 在这里插入图片描述
TEST.h和TEST.c是公共模块。
test1.h和test1.c使用了公共模块。
test2.h和test2.c使用了公共模块。
test.h和test.c使用了test1模块和test2模块。
这样最终程序中就会出现两份TEST.h的内容。这样就造成了文件内容的重复。
我们可以使用条件编译去解决这个问题
每个头文件开头写：