C语言学习之程序编译与链接

本文将总结学到的关于程序编译与链接的知识。
首先,编译分三个步骤,分别是:预处理(预编译),编译,汇编。
当编译完成后就进入链接。

1.程序的翻译环境和执行环境

在ANSI C的实现中,存在两个不同的环境:
1.翻译环境:在这个环境中,源代码将被翻译成可执行的机器指令;
2.执行环境:实际执行代码的环境。

2.编译+链接

1. 翻译环境

  • 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
  • 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
  • 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。
预处理阶段:预处理指令,将#define 等指令替换到源代码中并删除,生成test.i文件
编译阶段:进行语法、词法、语义分析及符号汇总等工作,并生成test.s文件
汇编阶段:形成符号表,汇编指令转换成二进制指令,并生成test.o文件
链接:合并段表,并进行符号表的合并与重定位。

2. 运行环境

程序执行过程:

  1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
  2. 程序的执行便开始。接着便调用main函数。
  3. 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
  4. 终止程序。正常终止main函数;也有可能是意外终止。

3.预处理

1. 常见预定义符号(注意:符号两边都分别有两个下划线__*__):

FILE //进行编译的源文件
LINE //文件当前的行号
DATE //文件被编译的日期
TIME //文件被编译的时间
STDC //如果编译器遵循ANSI C,其值为1,否则未定义

如:
printf("file:%s line:%d\n", __FILE__, __LINE__);

2. #define 定义标识符

语法:
#define name stuff
使用注意事项:

  1. #define使用后不要加;,否则容易出现错误;
  2. 写name过程中不要有空格,不然会将空格后的内容归到stuff内;
  3. 在使用定义好的name时,在预处理阶段实际上是将name替换为内容stuff,与函数的实现不一样,所以内容stuff要加括号来保证运行的正确性;
    举个例子:
#define A 2+2
#define B 3+3
#define C (2+2)
#define D (3+3)
int main()
{
	int i = A*B; //实际执行效果为:2+2*3+3 = 11
	int j = C*D; //实际执行效果为:(2+2)*(3+3) = 24
	return 0;
}

3. #define 替换规则

在程序中扩展#define定义符号和宏时,需要涉及几个步骤。

  1. 在调用宏时,首先对参数进行检查,看看是否包含任何由#define定义的符号。如果是,它们首先被替换。
  2. 替换文本随后被插入到程序中原来文本的位置。对于宏,参数名被他们的值所替换。
  3. 最后,再次对结果文件进行扫描,看看它是否包含任何由#define定义的符号。如果是,就重复上述处理过程。

注意:

  1. 宏参数和#define 定义中可以出现其他#define定义的符号。但是对于宏,不能出现递归。
  2. 当预处理器搜索#define定义的符号的时候,字符串常量的内容并不被搜索。

4. #与##

  1. #号作用
    1.作为预定义符号;
    2.把一个宏参数变成对应的字符串;
    例子:
    int i = 10; #define PRINT(FORMAT, VALUE)\ printf("the value of " #VALUE "is "FORMAT "\n", VALUE); ... PRINT("%d", i+3);
    结果:
the value of i+3 is 13
  1. ##的作用
    ##可以把位于它两边的符号合成一个符号。它允许宏定义从分离的文本片段创建标识符。
#define ADD_TO_SUM(num, value) \
 sum##num += value;
...
ADD_TO_SUM(5, 10);//作用是:给sum5增加10.
#define CAT(X, Y) X##Y //字符串拼接,等价于"XY"

5. 带副作用的宏参数

当宏参数在宏的定义中出现超过一次的时候,如果参数带有副作用,那么你在使用这个宏的时候就可能
出现危险,导致不可预测的后果。副作用就是表达式求值的时候出现的永久性效果。
例如:

x+1;//不带副作用
x++;//带有副作用

#define MAX(a, b) ( (a) > (b) ? (a) : (b) )
...
x = 5;
y = 8;
z = MAX(x++, y++);
printf("x=%d y=%d z=%d\n", x, y, z);

我们知道:

z = ( (x++) > (y++) ? (x++) : (y++));

最后的结果是:

x=6 y=10 z=9

6. 宏与函数的对比

  1. 用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。所以宏比函数在程序的规模和速度方面更胜一筹。
  2. 更为重要的是函数的参数必须声明为特定的类型。所以函数只能在类型合适的表达式上使用。反之这个宏怎可以适用于整形、长整型、浮点型等可以用于>来比较的类型。宏是类型无关的。

宏的缺点:

  1. 每次使用宏的时候,一份宏定义的代码将插入到程序中。除非宏比较短,否则可能大幅度增加程序的长度。
  2. 宏是没法调试的。
  3. 宏由于类型无关,也就不够严谨。
  4. 宏可能会带来运算符优先级的问题,导致程容易出现错。
  5. 宏是不能递归的。

宏有时候可以做函数做不到的事情。比如:宏的参数可以出现类型,但是函数做不到

#define MALLOC(num, type)\
 (type *)malloc(num * sizeof(type))
...
//使用
MALLOC(10, int);//类型作为参数
//预处理器替换之后:
(int *)malloc(10 * sizeof(int));

7. 命名规定

把宏名全部大写
函数名不要全部大写

8. undef

#undef NAME
//如果现存的一个名字需要被重新定义,那么它的旧名字首先要被移除。

4.编译

1. 条件编译

在编译一个程序的时候我们如果要将一条语句(一组语句)编译或者放弃是很方便的。因为我们有条件编译指令。

调试性的代码,删除可惜,保留又碍事,所以我们可以选择性的编译。

#include <stdio.h>
#define __DEBUG__
int main()
{
 int i = 0;
 int arr[10] = {0};
 for(i=0; i<10; i++)
 {
 arr[i] = i;
 
 #ifdef __DEBUG__ //如果定义了__DEBUG__,就执行以下程序
 printf("%d\n", arr[i]);//为了观察数组是否赋值成功。 
 #endif //__DEBUG__
 }
 return 0;
}

常见的条件编译指令:

1.
#if 常量表达式
 //...
#endif
//常量表达式由预处理器求值。
如:
#define __DEBUG__ 1
#if __DEBUG__
 //..
#endif
2.多个分支的条件编译
#if 常量表达式
 //...
#elif 常量表达式
 //...
#else
 //...
#endif
3.判断是否被定义
#if defined(symbol)
#ifdef symbol
#if !defined(symbol)
#ifndef symbol
4.嵌套指令
#if defined(OS_UNIX)
 #ifdef OPTION1
 unix_version_option1();
 #endif
 #ifdef OPTION2
 unix_version_option2();
 #endif
#elif defined(OS_MSDOS)
 #ifdef OPTION2
 msdos_version_option2();
 #endif
#endif

2. 文件包含

  1. 本地头文件包含:
#include "filename"

查找策略:

先在源文件所在目录下查找,如果该头文件未找到,编译器就像查找库函数头文件一样在标准位置查找头文件。如果找不到就提示编译错误。

  1. 库文件包含:
#include <stdio.h>

查找策略:

查找头文件直接去标准路径下去查找,如果找不到就提示编译错误。

建议正确使用文件包含符号.

对于库文件也可以使用 “” 的形式包含,但是这样做查找的效率就低些,当然这样也不容易区分是库文件还是本地文件了。

3.嵌套文件包含:
在这里插入图片描述

comm.h和comm.c是公共模块。
test1.h和test1.c使用了公共模块。
test2.h和test2.c使用了公共模块。
test.h和test.c使用了test1模块和test2模块。
这样最终程序中就会出现两份comm.h的内容。这样就造成了文件内容的重复。

用条件编译可避免此类问题。

每个头文件开头写这样一段内容

#ifndef __TEST_H__
#define __TEST_H__
//头文件的内容
#endif   //__TEST_H__

或者

#pragma once

5.最后

C语言中还有很多预处理指令,可以在https://legacy.cplusplus.com/中查找,这里就不一一赘述了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值