栈:
在32位系统中一个进程可以分到4gb的虚拟内存空间 但是这4gb不是真实存在的 而是可用空间大小 但是这些内存空间物理上也不一定是连续的 而是一种逻辑上的连续
如上图:我们可以看到一个程序的基本结构,代码区存放硬编码,数据区存放需要的数据,BSS存放全局变量,堆存放自主分配的内存,缓冲区为了防止堆栈的覆盖,栈区存放的就是函数调用留下的信息。
对于函数的调用:父函数调用子函数,当子函数完成后,cpu将返回到父函数的下一行继续执行,这和栈的先入后出的结构是非常相似的,所以在c语言中使用了栈的结构来辅助函数的调用
我们可以在栈上存放函数的参数列表,返回地址,局部变量,上下文等等信息
如上图的一个简单的程序,在main中调用了函数fun(),当我们调用执行完fun(1,2)我们就需要继续向下执行下一条语句。
我们查看这段代码的汇编代码
这句是对f(1,2)函数的调用,我们可以看到在进行call之前,我们需要进行两个push操作(压栈),将两个参数压入栈中,栈变为图中的样子
然后使用了call函数,相当于一个push eip的操作,然后进行一个jmp到指定位置,栈变为了
图中所示为0x401005位置,所以pc到了下面的位置
这里由进行一个jmp操作,为什么不直接跳转到函数的开始位置;这样写的好处在于,当我们对函数进行了修改导致函数开始位置发生了变化,可以直接修改这个的地址,而不需要去一个个找代码中的函数调用。
经过一个jmp,我们到了下图的代码
我们一条条来执行
首先push ebp
mov ebp,esp
sub esp,44h
push ebx;push esi;push edi
lea edi,[edp-44h]
mov ecx,11h
mov eax,0cccccccch
rep stos dword ptr [edi]
0xcccccccc构成了缓冲区,主要是用于防止eip,ebp的值被覆盖了,也可以用于局部变量的存放,缓冲区的大小编译器会根据函数的复杂程度来进行调整
从下面的对于int i=a+b我们可以看到,对于a和b,也就是形参,主要是通过dword ptr [ebp+xx]进行获取,也就是使用ebp这个寄存器来进行定位的。
我们直接跳过执行过程,直接到return i指令,我们将a+b的运行结果作为返回值,存放到eax中了
之后进行的就是栈的回收操作,但是这里汇编忘记截图了,只能用栈图来演示了
首先回收栈,会进行pop操作,
pop edi;pop esi;pop ebx;add esp,0x44
然后进行的是pop ebp操作,这时候ebp回到了函数调用前,ebp的位置
ret 操作,相当于pop eip的操作,这时候eip的值就是函数调用后的位置也就是main函数中的call后面一条指令
现在eip到了main函数中的add 指令,进行add esp,8
这时候esp减去形参的字节大小,到达了在调用这个函数之前的位置。
这样一套操作,我们就达到了对函数的调用执行,我们在父函数中调用了子函数,结果子函数的堆栈的构建和回收,我们又到了父函数的堆栈中。