关于堆栈溢出的一点疑问

http://www.oldlinux.org/oldlinux/archiver/?tid-7890.html

堆和栈

一般认为在c中分为这几个存储区
1栈 - 有编译器自动分配释放
2堆 - 一般由程序员分配释放,若程序员不释放,程序结束时可能由OS回收
3全局区(静态区),全局变量和静态变量的存储是放在一块的,初始化的全局变量和静态变量在一块
区域,未初始化的全局变量和未初始化的静态变量在相邻的另一块区域。
- 程序结束释放
4另外还有一个专门放常量的地方。 - 程序结束释放
在函数体中定义的变量通常是在栈上,用malloc, calloc, realloc等分配内存的函数分配得到的就是
在堆上。在所有函数体外定义的是全局量,加了static修饰符后不管在哪里都存放在全局区(静态
区),在所有函数体外定义的static变量表示在该文件中有效,不能extern到别的文件用,在函数体内
定义的static表示只在该函数体内有效。另外,函数中的"adgfdf"这样的字符串存放在常量区。
比如:
代码:
int a = 0; //全局初始化区
char *p1; //全局未初始化区
main()
{
int b; //栈
char s[] = "abc"; //栈
char *p2; //栈
char *p3 = "123456"; //123456/0在常量区,p3在栈上。
static int c = 0; //全局(静态)初始化区
p1 = (char *)malloc(10);
p2 = (char *)malloc(20);
//分配得来得10和20字节的区域就在堆区。
strcpy(p1, "123456");
//123456/0放在常量区,编译器可能会将它与p3所指向的"123456"优化成一块。
}

还有就是函数调用时会在栈上有一系列的保留现场及传递参数的操作。
栈的空间大小有限定,vc的缺省是2M。栈不够用的情况一般是程序中分配了大量数组和递归函数层次太
深。有一点必须知道,当一个函数调用完返回后它会释放该函数中所有的栈空间。栈是由编译器自动管
理的,不用你操心。
堆是动态分配内存的,并且你可以分配使用很大的内存。但是用不好会产生内存泄漏。
并且频繁地malloc和free会产生内存碎片(有点类似磁盘碎片),因为c分配动态内存时是寻找匹配的
内存的。而用栈则不会产生碎片。
在栈上存取数据比通过指针在堆上存取数据快些。
一般大家说的堆栈和栈是一样的,就是栈(stack),而说堆时才是堆heap.
栈是先入后出的,一般是由高地址向低地址生长。

 

另外一篇:
堆(heap)和栈(stack)是C/C++编程不可避免会碰到的两个基本概念。首先,这两个概念都可以在讲数据
结构的书中找到,他们都是基本的数据结构,虽然栈更为简单一些。
在具体的C/C++编程框架中,这两个概念并不是并行的。对底层机器代码的研究可以揭示,栈是机器系
统提供的数据结构,而堆则是C/C++函数库提供的。
具体地说,现代计算机(串行执行机制),都直接在代码底层支持栈的数据结构。这体现在,有专门的寄
存器指向栈所在的地址,有专门的机器指令完成数据入栈出栈的操作。
这种机制的特点是效率高,支持的数据有限,一般是整数,指针,浮点数等系统直接支持的数据类型,
并不直接支持其他的数据结构。因为栈的这种特点,对栈的使用在程序中是非常频繁的。对子程序的调
用就是直接利用栈完成的。机器的call指令里隐含了把返回地址推入栈,然后跳转至子程序地址的操
作,而子程序中的ret指令则隐含从堆栈中弹出返回地址并跳转之的操作。C/C++中的自动变量是直接利
用栈的例子,这也就是为什么当函数返回时,该函数的自动变量自动失效的原因。
和栈不同,堆的数据结构并不是由系统(无论是机器系统还是操作系统)支持的,而是由函数库提供的。
基本的malloc/realloc/free函数维护了一套内部的堆数据结构。当程序使用这些函数去获得新的内存
空间时,这套函数首先试图从内部堆中寻找可用的内存空间,如果没有可以使用的内存空间,则试图利
用系统调用来动态增加程序数据段的内存大小,新分配得到的空间首先被组织进内部堆中去,然后再以
适当的形式返回给调用者。当程序释放分配的内存空间时,这片内存空间被返回内部堆结构中,可能会
被适当的处理(比如和其他空闲空间合并成更大的空闲空间),以更适合下一次内存分配申请。这套复杂
的分配机制实际上相当于一个内存分配的缓冲池(Cache),使用这套机制有如下若干原因:
1. 系统调用可能不支持任意大小的内存分配。有些系统的系统调用只支持固定大小及其倍数的内存请
求(按页分配);这样的话对于大量的小内存分类来说会造成浪费。
2. 系统调用申请内存可能是代价昂贵的。系统调用可能涉及用户态和核心态的转换。
3. 没有管理的内存分配在大量复杂内存的分配释放操作下很容易造成内存碎片。
堆和栈的对比
从以上知识可知,栈是系统提供的功能,特点是快速高效,缺点是有限制,数据不灵活;而栈是函数库
提供的功能,特点是灵活方便,数据适应面广泛,但是效率有一定降低。栈是系统数据结构,对于进
程/线程是唯一的;堆是函数库内部数据结构,不一定唯一。不同堆分配的内存无法互相操作。栈空间
分静态分配和动态分配两种。静态分配是编译器完成的,比如自动变量(auto)的分配。动态分配由
alloca函数完成。栈的动态分配无需释放(是自动的),也就没有释放函数。为可移植的程序起见,栈的
动态分配操作是不被鼓励的!堆空间的分配总是动态的,虽然程序结束时所有的数据空间都会被释放回
系统,但是精确的申请内存/释放内存匹配是良好程序的基本要素。

<think>好的,用户现在问的是在x86汇编中执行'push ax'指令后,AX寄存器的值会不会变化。我需要先回顾一下x86的PUSH指令相关知识。 首先,根据之前的知识,PUSH指令的作用是将操作数压入堆栈。对于16位的寄存器如AX来说,PUSH AX会将AX的值存入堆栈,同时堆栈指针SP会减少2个字节,因为每个16位数据占2个字节。例如,假设SP原来指向0x1000,执行后SP变为0x0FFE,AX的值会被存储在0x0FFE和0x0FFF这两个地址中。 接下来,用户关心的是AX的值是否变化。根据x86架构的设计,PUSH指令的操作不会改变源寄存器的值,只会将数据复制到堆栈中。因此,执行PUSH AX后,AX中的值应该保持不变。这一点需要确认,可能需要查阅指令手册或者可靠的资料。 然后,用户提供的引用中,引用[2]提到了PUSHAD指令,它会影响多个寄存器,但PUSHAD和PUSH AX是不同的指令,不过这里可以推断,PUSH系列指令通常不会修改源寄存器的值,只会修改堆栈指针。例如,PUSHAD将多个寄存器的值压栈,但压栈后这些寄存器的值不变,只是ESP减少了相应的字节数。 另外,用户之前的问题涉及到补码和段寄存器的调整,但当前的问题集中在PUSH指令对AX的影响,所以需要将焦点放在这里。可能需要举例说明,比如执行PUSH AX之前和之后AX的值是否一致,以及SP的变化情况。 考虑到用户可能存在的疑问,比如为什么堆栈操作不影响源寄存器,或者是否在某些特殊情况下会有变化,需要进一步解释。例如,是否在中断处理或其他上下文中使用PUSH会导致AX变化?答案应该是否定的,因为PUSH指令本身只负责复制数据到堆栈,不会修改源寄存器。 最后,总结时需明确指出,PUSH AX不会改变AX的值,只会改变SP和堆栈内容。同时,可以提出相关问题,帮助用户深入理解,比如其他PUSH指令的影响,或者堆栈操作中的其他注意事项。</think>### 分步解释 在x86汇编中,执行`push ax`指令时,**AX寄存器的值不会发生任何变化**。该指令的核心作用是将AX的值复制到堆栈中,而非修改AX本身。以下是详细分析: --- ### 一、`push ax`指令的执行过程 1. **操作定义** `push ax`指令执行两个步骤: - **步骤1**:将堆栈指针(SP)减2(16位模式下,每个堆栈操作单位为2字节) $$ \text{新SP} = \text{原SP} - 2 $$ - **步骤2**:将AX的值写入新的堆栈顶部(即`[SS:SP]`指向的内存地址) 2. **寄存器值变化** - **AX**:保持不变 - **SP**:减少2 - **其他寄存器**:不影响(如IP、FLAGS等) --- ### 二、验证示例 #### 场景:初始状态 ```assembly mov ax, 0x1234 ; AX = 0x1234 mov sp, 0x1000 ; SP = 0x1000 push ax ; 执行push指令 ``` #### 执行后的内存与寄存器状态 | 寄存器/内存地址 | 值 | 说明 | |-----------------|-------------|--------------------------| | AX | **0x1234** | 未改变 | | SP | 0x0FFE | 原SP(0x1000) - 2 = 0x0FFE | | 内存地址0x0FFE | 0x34 | AX的低字节(小端序) | | 内存地址0x0FFF | 0x12 | AX的高字节 | --- ### 三、关键特性总结 | 特性 | 说明 | |---------------------|----------------------------------------------------------------------| | **非破坏性操作** | `push`仅复制寄存器值到堆栈,不影响源寄存器内容 | | **堆栈对齐** | 16/32/64位模式下,SP/ESP/RSP的调整量分别为2/4/8字节[^1] | | **内存写入顺序** | 小端序存储(低字节在前,高字节在后) | --- ### 四、常见误区澄清 1. **为何不直接操作AX?** `push`指令设计初衷是保存寄存器当前值,用于后续恢复(如函数调用、中断处理),因此必须保留原值。 2. **与`pop ax`的对比** - `push ax`:复制AX到堆栈,AX不变 - `pop ax`:从堆栈恢复数据到AX,**会覆盖AX原值**,同时SP增加2。 --- ### 五、扩展应用场景 1. **函数调用参数传递** ```assembly mov ax, [data] push ax ; 保存参数到堆栈 call func ; 调用函数(函数内部通过堆栈访问参数) add sp, 2 ; 清理堆栈 ``` 2. **中断上下文保存** 中断处理程序通常以`pusha`(保存所有通用寄存器)开始,确保中断返回后寄存器状态不变[^2]。 --- ### 六、相关指令对比 | 指令 | 操作数位数 | SP变化 | 源寄存器影响 | 典型用途 | |------------|------------|--------|--------------|------------------------| | `push ax` | 16位 | -2 | 无 | 保存AX到堆栈 | | `push eax` | 32位 | -4 | 无 | 32位模式下的寄存器保存 | | `push rax` | 64位 | -8 | 无 | x86-64系统编程 | --- ### 七、特殊注意事项 - **堆栈溢出风险**:频繁`push`而未及时`pop`可能导致SP超出堆栈段边界,引发异常。 - **特权级限制**:在保护模式下,堆栈操作可能受段权限限制(如不可写段会触发GP异常)[^3]。 --- ### 八、调试验证方法 通过调试器(如GDB或DOSBox的Debug模式)单步执行以下代码片段: ```assembly mov ax, 0x5678 mov sp, 0xFFFE push ax ``` 可观察到: 1. AX保持0x5678不变 2. SP变为0xFFFC 3. 内存地址0xFFFC-0xFFFD存储0x78 0x56(小端序) --- --相关问题--: 1. `push`指令如何影响堆栈内存的具体布局? 2. 在64位模式下,`push rax`与`push ax`的堆栈操作有何区别? 3. 为什么x86架构使用`sp -= 2`而非`sp += 2`实现堆栈增长? [^1]: 堆栈操作的单位长度与处理器模式直接相关(16/32/64位对应2/4/8字节调整)。 [^2]: `pusha`/`popa`指令在保护模式下可能受权限限制,需结合当前特权级(CPL)判断。 [^3]: 段描述符中的`DPL`(Descriptor Privilege Level)会限制堆栈段的写入操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值