c语言变量存储问题
在函数体中定义的变量通常是在栈上,用malloc, calloc, realloc等分配内存的函数分配得到的就是在堆上。
在函数外部定义的变量(全局变量或静态外部变量)和在函数内部定义的static变量,其生存期就是程序运行的全过程,这些变量被存储在数据段(datasegment)中。
在函数内部定义的auto变量(没有用关键字static定义的变量)的生存期从程序开始执行其所在的程序块代码时开始,到程序离开该程序块时为止。作为函数参数的变量只在调用该函数期间存在。这些变量被存储在栈(stack)中。
你的变量究竟存储在什么地方?
作者:杨小华
我相信大家都有过这样的经历,在面试过程中,考官通常会给你一道题目,然后问你某个变量存储在什么地方,在内存中是如何存储的等等一系列问题。不仅仅是在面试中,学校里面的考试也会碰到同样的问题。
如果你还不知道答案,请接着往下看。接下来,我们将在Linux操作系统上,以GCC编译器为例来讲解变量的存储。
在计算机系统中,目标文件通常有三种形式:
1.可重定位的目标文件:包含二进制代码和数据,与其他可重定位目标文件合并起来,创建一个可执行目标文件。
2.可执行的目标文件:包含二进制代码和数据,其形式可以被直接拷贝到存储器中并执行
3.共享目标文件:一种特殊的可重定位目标文件,即我们通常所说的动(静)态链接库
一个典型的可重定位目标文件如下图所示:
高地址
节头部表
.strtab
.line
.debug
.rel.data
.rel.text
.symtab
.bss
.data (3)
.rodata
.text (1)
ELF头
0
图 1典型的ELF可重定位目标文件(数字代表索引)
夹在ELF头和节头部表之间的都是节(section),各个节的意思如下:
节
含义
.text
已编译程序的机器代码
.rodata
只读数据,如pintf和switch语句中的字符串和常量值
.data
已初始化的全局变量
.bss
未初始化的全局变量
.symtab
符号表,存放在程序中被定义和引用的函数和全局变量的信息
.rel.text
当链接器把这个目标文件和其他文件结合时,.text节中的信息需修改
.rel.data
被模块定义和引用的任何全局变量的信息
.debug
一个调试符号表。
.line
原始C程序的行号和.text节中机器指令之间的映射
.strtab
一个字符串表,其内容包含.systab和.debug节中的符号表
对于static类型的变量,gcc编译器在.data和.bss中为每个定义分配空间,并在.symtab节中创建一个有唯一名字的本地链接器符号。对于malloc而来的变量存储在堆(heap)中,局部变量都存储在栈(stack)中。
下面我们以实际的例子来分析变量的存储:
#include
#include
#include
int z = 9;
int a;
static int b =10;
static int c;
void swap(int* x,int* y)
{
int temp;
temp=*x;
*x=*y;
*y=temp;
}
int main()
{
int x="4",y=5;
swap(&x,&y);
printf(“x=%d,y=%d,z=%d,w=%d\n”,x,y,z,b);
return 0;
}
根据以上题目和理论知识,我们可以推断出:
变量
存储区域
a
.bss
b
.data
c
.bss
x
stack
y
stack
temp
stack
z
.data
swap
.text
main
.text
x=……
.rodata
我们将从 汇编代码和符号表中来分析以上答案是否正确。我们首先来看该程序的汇编代码:
.file "var.c"
.globl z
.data #数据段
.align 4
.type z, @object
.size z, 4
z:
.long 9
.align 4
.type b, @object
.size b, 4
b:
.long 10
.text #代码段
.globl swap
.type swap, @function
swap:
pushl %ebp
movl %esp, %ebp
subl $4, %esp
movl 8(%ebp), %eax
movl (%eax), %eax
movl %eax, -4(%ebp)
movl 8(%ebp), %edx
movl 12(%ebp), %eax
movl (%eax), %eax
movl %eax, (%edx)
movl 12(%ebp), %edx
movl -4(%ebp), %eax
movl %eax, (%edx)
leave
ret
.size swap, .-swap
.section .rodata #只读段
.LC0:
.string "x=%d,y=%d,z=%d,w=%d\n"
.text #代码段
.globl main
.type main, @function
main:
pushl %ebp
movl %esp, %ebp
subl $40, %esp
andl $-16, %esp
movl $0, %eax
subl %eax, %esp
movl $4, -4(%ebp)
movl $5, -8(%ebp)
leal -8(%ebp), %eax
movl %eax, 4(%esp)
leal -4(%ebp), %eax
movl %eax, (%esp)
call swap
movl b, %eax
movl %eax, 16(%esp)
movl z, %eax
movl %eax, 12(%esp)
movl -8(%ebp), %eax
movl %eax, 8(%esp)
movl -4(%ebp), %eax
movl %eax, 4(%esp)
movl $.LC0, (%esp)
call printf
movl $0, %eax
leave
ret
.size main, .-main
.comm a,4,4
.local c
.comm c,4,4
.section .note.GNU-stack,"",@progbits
.ident "GCC: (GNU) 3.3.5 (Debian 1:3.3.5-13)"
通过以上汇编代码可以发现,z和b在.data段,main和swap在.text段,a和c在.bss段,x,y,temp在stack中,printf函数所打印的字符串在.rodata中。
下面我们在通过符号表来解释变量的存储。
每个可重定位目标文件都有一个符号表,它包含该文件所定义和引用的符号的信息。在链接器的上下文中,有三种不同的符号:
1. 由该文件定义并能被其他模块引用的全局符号。即非静态的C函数和非静态的全局变量,如程序中的a,z,swap。
2. 由其他模块定义并被该文件引用的全局符号。用extern关键字所定义的变量和函数。
3. 只被该文件定义和引用的本地符号。用static关键字定义的函数和变量。如程序中的b和c。
该程序所对应的符号表如图所示:
图 2符号表
首先,我们解释上图中各字段的含义: