C程序内存布局学习总结

C程序的编译过程

由C语言代码(文本文件)形成可执行程序(二进制文件),需要经过编译-汇编-链接三个阶段。编译过程把c语言文本文件生成汇编程序,汇编过程把汇编程序形成二进制机器代码,链接过程则将各个源文件生成的二进制机器代码文件组合成一个文件。

C语言编写的程序经过编译-连接后,将形成一个统一格式的二进制可执行文件,这个格式是一个依照可执行文件格式的,可以被系统识别,并且加载到内存中执行的,它由几个部分组成。在程序运行时又会产生其他几个部分,各个部分代表了不同的存储区域:
这里写图片描述

C程序的内存布局介绍

程序组成

一个程序本质上都是由 BSS 段、data段、text段三个组成的。

  1. BSS段:在采用段式内存管理的架构中,BSS段(bss segment)通常是指用来存放程序中未初始化的全局变量的一块内存区域。BSS是英文Block Started by Symbol的简称。BSS段属于静态内存分配。

  2. 数据段:在采用段式内存管理的架构中,数据段(data segment)通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。

  3. 代码段:在采用段式内存管理的架构中,代码段(text segment)通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域属于只读。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。

如下图:
这里写图片描述

  1. .text即为代码段,为只读。
  2. .bss段包含程序中未初始化的全局变量和static变量。
  3. data段包含三个部分:heap(堆)、stack(栈)和静态数据区。

data段介绍

  1. 堆(heap):堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)

  2. 栈 (stack):栈又称堆栈, 是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变 量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以 栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。

  3. 静态数据区存放的是程序中已初始化的全局变量、静态变量和常量。

实例学习

int a = 0; //全局初始化区,data段  
  static int b=20; //全局初始化区,data段  
  char *p1; //全局未初始化区 .bss段  
  const int A = 10; //.rodata段  
  void main(void)  
  {  
  int b; //栈  
  char s[] = "abc"; //栈  
  char *p2; //栈  
  static int c = 0; //全局(静态)初始化区 .data段  
  char *p3 = "123456"; //123456\0在常量区,p3 在栈上。  
  p1 = (char*) malloc(10);//分配得来的10和20个字节的区域就在堆区  
  p2 = (char*) malloc(20);  
  strcpy(p1, "123456"); //123456\0 在常量区,编译器可能会将它与p3所指向的"123456"优化成一个地方  
}  

在这里有几点需要注意:
1.
局变量和静态变量的存储是放在一块的,
初始化的全局变量和静态变量在一块区域(RW data),
未初始化的全局变量和未初始化的静态变量在相邻的另一块区域(BSS)。
程序结束后由系统释放

2.
对于常量我们需要注意的问题在于,他们并不像我们期望的那样存储在常量区(RO data), 常量区只用于存储初始化好的全局常量以及字符串变量本身(不是指针)

局部常量作为局部量仍然存储与栈中
因为常量区与代码段是在一起的(在有些段分类结果中,是不存在常量区的,常量区和代码段合成为代码区)

而本身来说常量只是限制了其读写权限,这种读写权限的限制可以在编译阶段由编译器进行制定和限制

这样在严格的编译器审查结果下,运行阶段的代码就不存在对常量的读写操作,因此就没必要将其他局部常量也存储在常量区 否则将造成代码段的臃肿。

数据存储类别

讨论C/C++中的内存布局,不得不提的是数据的存储类别!数据在内存中的位置取决于它的存储类别。一个对象是内存的一个位置,解析这个对象依赖于两个属性:存储类别、数据类型。

① 存储类别决定对象在内存中的生命周期。
② 数据类型决定对象值的意义,在内存中占多大空间。

C/C++中由(auto、 extern、 register、 static)存储类别和对象声明的上下文决定它的存储类别。

自动对象(automatic objects)

auto和register将声明的对象指定为自动存储类别。他们的作用域是局部的,诸如一个函数内,一个代码块{*}内等。操作了作用域,对象会被销毁。

在一个代码块中声明一个对象,如果没有执行auto,那么默认是自动存储类别。
声明为register的对象是自动存储类别,存储在计算机的快速寄存器中。不可以对register对象做取值操作“&”。

静态对象(static objects)

    静态对象可以局部的,也可以是全局的。静态对象一直保持它的值,例如进入一个函数,函数中的静态对象仍保持上次调用时的值。包含静态对象的函数不是线程安全的、不可重入的,正是因为它具有“记忆”功能。
    局部对象声明为静态之后,将改变它在内存中保存的位置,由动态数据--->静态数据,即从堆或栈变为数据段或bbs段。
    全局对象声明为静态之后,而不会改变它在内存中保存的位置,仍然是在数据段或bbs段。但是static将改变它的作用域,即该对象仅在本源文件有效。此相反的关键字是extern,使用extern修饰或者什么都不带的全局对象的作用域是整个程序。

总结图:

这里写图片描述

参考链接:
http://blog.youkuaiyun.com/gatieme/article/details/43567433 强烈推荐
http://www.cnblogs.com/fengyv/p/3789252.html

<think>好的,我现在需要详细解释程序内存布局,包括栈、堆、全局变量区和代码段。首先,我得回忆一下用户提供的引用内容,里面有关于C语言内存布局的不同部分的描述,比如代码段、数据段、BSS段、堆、栈等。用户提到的引用[2]、[3]、[4]、[5]都涉及到这些区域,所以需要整合这些信息,确保准确性和全面性。 首先,用户的问题是关于程序内存布局的详解,可能他们正在学习内存管理,或者遇到内存相关的问题,比如溢出、泄漏等。因此,回答需要结构清晰,分点解释每个部分的作用、存储内容以及特点。 接下来,我需要确定每个内存区域的正确名称和定义。根据引用[2]和[4],BSS段存放未初始化的全局变量,数据段存放已初始化的全局变量,代码段是只读的,存放执行代码和常量。引用[3]提到C的内存分为静态存储区、堆、栈和常量区,而C++则分为五个区。但用户的问题可能更偏向C语言,所以需要以C的内存布局为主。 然后,栈和堆的区别是关键。栈由编译器自动管理,存放局部变量和函数调用信息,而堆需要手动分配和释放,如malloc和free。引用[5]提到用户空间的布局包括代码段、数据段、BSS、堆、内存映射区、栈段。这里可能需要将内存映射区也简要提及,但用户的问题没有提到,可能不需要深入。 需要注意的是,不同资料可能有不同的划分方式,比如有的将数据段分为初始化和未初始化(BSS),而有的可能分开描述。需要统一这些说法,避免混淆。 另外,用户提供的引用中有提到内存布局的影响,如性能和安全性,这些在回答中可以适当强调,帮助用户理解重要性。 现在需要组织内容,按照常见的顺序:代码段、数据段(初始化和BSS)、堆、栈,可能再加上其他区域如常量区。每个部分要说明存储的内容、生命周期、管理方式以及相关例子。例如,代码段是只读的,存放指令;数据段和BSS属于静态存储区,存放全局变量;堆动态分配,手动管理;栈自动管理,函数调用时使用。 需要检查是否有遗漏的部分,比如内存映射区是否应该提及?根据引用[5],用户空间有内存映射区,但用户的问题可能更关注基本部分,所以可能可以省略,或者简要提到。 例子方面,可以给出变量的存储位置,比如全局变量在数据段或BSS,局部变量在栈,动态分配的变量在堆。这样用户更容易理解。 最后,生成相关问题,需要围绕内存布局的不同区域、作用、管理方式以及常见问题,比如内存泄漏、溢出等。确保问题与主题相关,能够帮助用户进一步学习。 总结步骤: 1. 概述内存布局的重要性(引用用户的问题动机)。 2. 分点详细说明每个区域:代码段、数据段、BSS、堆、栈。 3. 每个区域包括存储内容、特点、管理方式、例子。 4. 对比不同区域的区别,如栈和堆。 5. 最后生成相关问题,如各区域的生命周期、常见错误等。</think>### 程序内存布局详解 程序内存布局程序运行时数据存储的核心结构,直接影响内存分配、变量生命周期及程序稳定性。以下为典型C/C++程序内存布局详解,包含栈、堆、全局变量区(数据段与BSS段)及代码段: --- #### 1. **代码段(Text Segment)** - **存储内容**:可执行程序的机器指令(如函数代码)、字符串常量和只读变量(如`const`修饰的全局常量)[^5]。 - **特点**: - 只读权限,防止程序意外修改指令。 - 大小在程序加载时确定,生命周期与程序一致。 - **示例**: ```c const int MAX = 100; // 只读变量存储在代码段 ``` --- #### 2. **全局变量区(数据段与BSS段)** - **数据段(Data Segment)** - **存储内容**:已初始化的全局变量和静态变量(如`static int a = 5;`)[^2][^4]。 - **特点**:程序启动时分配内存,生命周期持续到程序结束。 - **BSS段(Block Started by Symbol)** - **存储内容**:未初始化的全局变量和静态变量(如`int global_var;`),默认值自动设为0或`NULL`[^2][^4]。 - **特点**:不占用实际磁盘空间,仅在运行时分配内存。 - **示例**: ```c int data_var = 10; // 数据段 static int bss_var; // BSS段 ``` --- #### 3. **堆(Heap)** - **存储内容**:动态分配的内存(如通过`malloc`、`new`申请的空间)。 - **特点**: - 手动管理:需显式释放(`free`或`delete`),否则可能引发内存泄漏[^3]。 - 空间较大但分配效率低于栈。 - **示例**: ```c int *ptr = (int*)malloc(10 * sizeof(int)); // 堆区分配数组 ``` --- #### 4. **栈(Stack)** - **存储内容**:局部变量、函数参数、返回地址等函数调用信息。 - **特点**: - 自动管理:由编译器分配和释放,效率高。 - 空间有限,过度使用可能导致栈溢出(如递归过深)。 - **示例**: ```c void func() { int local_var = 20; // 栈区变量 } ``` --- #### 内存布局对比表 | 区域 | 存储内容 | 管理方式 | 生命周期 | |--------------|------------------------|------------|----------------| | **代码段** | 指令、常量 | 自动 | 程序运行期间 | | **数据段** | 已初始化全局/静态变量 | 自动 | 程序运行期间 | | **BSS段** | 未初始化全局/静态变量 | 自动 | 程序运行期间 | | **堆** | 动态分配数据 | 手动 | 手动释放前 | | **栈** | 局部变量、函数调用信息 | 自动 | 函数执行期间 | --- #### 常见问题与注意事项 1. **栈溢出**:递归过深或局部变量过大导致,可能引发程序崩溃。 2. **内存泄漏**:堆区未释放内存,长期运行可能耗尽系统资源。 3. **野指针**:访问已释放的堆内存,导致未定义行为。 ---
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值