(转载)实例说明代码段(.text)、数据段(.data)、bss段、只读数据段(.rodata)、堆栈的划分依据

本文通过一个C语言程序实例,详细分析了目标文件中代码段(.text)、数据段(.data)、bss段和只读数据段(.rodata)的划分依据。代码段存放机器指令,数据段包含初始化全局变量和局部变量,.bss段用于未初始化的变量,.rodata段则存储const变量和字符串常量。这样的划分有利于内存保护、缓存效率提升及节省内存空间。通过objdump工具,我们可以观察到各段的实际大小与变量分配情况。

程序实例介绍各个段内容、分析段(segment)分布

先举个小例子说明,让大家有个表面的印象。

下面的程序定义了一些不同类型的变量,主要包括初始化的全局变量(globle_var1 )和静态全局变量(globle_static_var1 )、未初始化的全局变量(globle_var2)和静态全局变量(globle_static_var2)、常量(globle_const_var 、const_var )和局部变量(var1 、var2)。并通过函数func进行打印输出求和结果,非常简单的一个程序。

//hello.c
#include<stdio.h>
int globle_var1 = 10;
int globle_var2;
static int globle_static_var1 = 20;
static int globle_static_var2;
const int globle_const_var = 30; 
void func(int i)
{
	printf("%d\n",i);
}
int main()
{
	static int static_var1 = 70;
	static int static_var2;
	const int const_var = 40;
	int var1 = 30;
	int var2;
	var2 = globle_var1+globle_static_var1+globle_const_var+static_var1+const_var+var1;
	func(var2);
	return 0;
}

目标文件中的内容至少包括编译后的机器指令代码、数据,还包括了链接时所需要的的一些信息,比如符号表、调试信息、字符串等。目标文件将这些信息按不同的属性以“ 段 ”(segment)的形式存储。以下就是一些常见的段。

并且还根据一个简单程序说明编译后的目标文件的结构。主要分析表格中常见的段信息,其实还有其他段例如注释信息段( .comment ),但这不是我们关注的重点。
段
下面的图是一个目标文件的结构分析,主要分析代码和数据存放在那些段中,图中没有给出堆栈段信息,因为堆栈需要在程序被装载准备运行才会分配,因此在目标文件这个阶段还没有分配栈段的内存。并且堆栈相信大家非常熟悉,栈就是存放函数局部变量,malloc()内存分配就是从堆分配的。
段信息

分析代码段(.text)、数据段(.data)、bss段、只读数据段(.rodata)划分依据

以前学习的时候我也只背住各个段分别存放什么内容,根本不知道为什么需要进行不同段的划分。下面分析一下划分的依据,以及这样划分有什么好处。

首先,可以先区分代码段数据段。程序源代码编译后的机器指令就会放在代码段里;然后这里的数据段包括" .data “、” .bss “、” .rodata ",将程序中定义的全局变量和局部变量都称先称为数据段。

为什么把程序的“ 代码段 ”和“ 数据段 ”分开存放?

  1. 当程序被装载后,数据和指令分别被映射到两个虚拟内存区域。数据段对进程来讲是可读写的,而代码段对进程来说是只读的,所以这两个虚拟内存区域的权限可以被分别设置为可读写和只读,防止程序的指令被有意和无意地改写。
  2. 现代CPU的缓存一般被设计成数据缓存和指令缓存分离,程序的指令和数据被分开存放对CPU的缓存命中率提高有好处。
  3. 当系统中运行着多个该程序的副本时,例如多个线程同时都运行同一个程序,它们的代码段指令都是一样的,所以内存中只需要保存一份该程序的代码段,然后将每个副本进程的数据段区域分来,这样可以节省大量空间。

为什么数据段还需要分" .data “、” .bss “、” .rodata "这么麻烦?有什么区别?
主要根据两个维度进行区分,是否占内存空间读写权限

以初始化的全局变量和局部静态变量都保存在" .data “段。未初始化的全局变量和局部静态变量一般都放在” .bss "段,因为未初始化的变量默认值为0,本来它们也可以放在.data段,但是因为它们都是0,所以为它们在.data段分配空间并且存放数据0是没有必要的。

" .data"段和" .bss “段都是可读写的数据段,而” .rodata “存放的是只读数据,主要是一些const变量和字符串常量。单独设立” .radata “段的好处是,在程序加载的时候可以将” .rodata “段的属性映射成只读,这样对这个段的任何修改操作都作为非法操作处理。另外在某些平台还可以将” .rodata "段存放在只读存储器,例如ROM,通过硬件保证只读。

所以如果通过命令objdump查看各个段的大小发现,.data段大小为12字节,正好是变量globle_var1、globle_static_var1、static_var1的大小。但是.bss段的大小为8个字节,并不是变量globle_var2、globle_static_var2、static_var2变量的大小,可以看出.bss并没有为变量分配内存。

zhouyuanlin@zhouyuanlin-virtual-machine:/mnt/hgfs/share$ ls
a.out  hello.c  hello.o
zhouyuanlin@zhouyuanlin-virtual-machine:/mnt/hgfs/share$ objdump -x -s -d hello.o
hello.o:     文件格式 elf64-x86-64
hello.o
体系结构:i386:x86-64, 标志 0x00000011:
HAS_RELOC, HAS_SYMS
起始地址 0x0000000000000000
节:
Idx Name          Size      VMA               LMA               File off  Algn
  0 .text         00000073  0000000000000000  0000000000000000  00000040  2**0
                  CONTENTS, ALLOC, LOAD, RELOC, READONLY, CODE
  1 .data         0000000c  0000000000000000  0000000000000000  000000b4  2**2
                  CONTENTS, ALLOC, LOAD, DATA
  2 .bss          00000008  0000000000000000  0000000000000000  000000c0  2**2
                  ALLOC
  3 .rodata       00000008  0000000000000000  0000000000000000  000000c0  2**2
                  CONTENTS, ALLOC, LOAD, READONLY, DATA
  4 .comment      00000036  0000000000000000  0000000000000000  000000c8  2**0
                  CONTENTS, READONLY
  5 .note.GNU-stack 00000000  0000000000000000  0000000000000000  000000fe  2**0
                  CONTENTS, READONLY
  6 .eh_frame     00000058  0000000000000000  0000000000000000  00000100  2**3

参考文献
[1] 俞甲子,石凡,潘爱民.程序员的自我修养——链接、装载与库[M].北京:电子工业出版社,2009.4

<think>好的,用户现在问的是关于C语言.data.bss.text.rodata这几个的问题。我需要先回忆一下这些各自的作用和区别。 首先,用户之前问了如何指定头文件路径编译,现在转向目标文件的结构,可能是在学习编译链接过程或者底层的内存管理。用户可能是刚开始学习C语言,或者是想更深入了解程序的内存布局。需要以简明的方式解释每个的作用,同时指出它们的区别和实际应用。 接下来,我要确保每个的解释准确无误。.text是存放可执行代码的,通常是只读的。.data存放已初始化的全局和静态变量,而.bss则是未初始化的,或者初始化为0的全局和静态变量,这里要注意区分初始化和未初始化的区别。.rodata只读数据,比如字符串常量和const变量。此外,还要提到这些在内存中的位置,比如.text.rodata通常是只读的,防止程序意外修改。 用户可能需要例子来理解,比如用代码示例说明不同变量存放在哪个。比如全局变量初始化和未初始化的例子,静态变量的例子,以及const修饰的变量是否进入.rodata。同时,要提到.bss在目标文件中不占空间,但在运行时分配内存,这样可以节省磁盘空间。 还要考虑用户可能的误区,比如未初始化的静态变量是否属于.bss,或者const变量的存储位置是否因编译器而异。需要指出这些细节,帮助用户正确理解。 最后,总结各个的区别,用表格或对比的方式,让用户一目了然。同时,可以提到实际应用中的注意事项,比如优化代码体积或内存使用时的考虑因素,比如将大型未初始化数组放在.bss可以减小可执行文件的大小。 需要确保语言通俗易懂,避免过于技术化的术语,但也要准确。可能用户在学习过程中遇到链接错误或者内存问题,理解这些有助于调试。因此,强调这些在程序运行中的作用和影响,帮助用户在实际编程中应用这些知识。</think>在C程序的内存布局中,`.data`、`.bss`、`.text`和`.rodata`是目标文件中的关键(section),其作用如下: --- ### 一、核心作用对照表 | 名称 | 存储内容 | 内存特性 | 初始状态 | |-----------|-----------------------------------|----------------|----------------| | `.text` | **可执行代码** | 只读 | 编译时确定 | | `.rodata` | **只读数据**(字符串常量、const变量) | 只读 | 编译时写入 | | `.data` | **已初始化的全局/静态变量** | 可读写 | 运行时加载初始值 | | `.bss` | **未初始化或零初始化的全局/静态变量** | 可读写 | 运行时清零 | --- ### 二、详细说明 #### 1. `.text` 代码段 - **存储内容**:编译后的机器指令 - **特性**: - 多个进程可共享同一份代码 - 具有**执行权限**但**不可写** - **示例**: ```c void func() { // 函数体代码存储在此 int x = 10; } ``` #### 2. `.rodata` 只读数据段 - **存储内容**: - 字符串字面量 `"Hello World"` - `const` 修饰的全局变量 - `switch-case` 跳转表 - **特殊限制**: ```c const int MAX = 100; // 进入.rodata char* ptr = "ReadOnly"; // 字符串本身在.rodata ``` #### 3. `.data` 数据段 - **存储内容**: - 显式初始化的全局变量 - 显式初始化的静态变量 - **特点**: - 占用磁盘空间(存储初始值) - 程序加载时复制到内存 - **示例**: ```c int initialized = 42; // 全局变量 static float pi = 3.14f; // 静态变量 ``` #### 4. `.bss` 未初始化 - **存储内容**: - 未初始化的全局/静态变量 - 零初始化的全局/静态变量 - **优势**: - **不占用磁盘空间**(仅记录内存大小) - 程序加载时自动填充零 - **示例**: ```c int uninitialized; // 进入.bss static char buffer[1024]; // 进入.bss int zero = 0; // 零初始化也进.bss ``` --- ### 三、内存布局示例 ``` 高地址 +------------------+ | 栈(stack) | | ↓ 生长方向 | +------------------+ | 堆(heap) | | ↑ 生长方向 | +------------------+ | .bss | ← 未初始化数据 +------------------+ | .data | ← 已初始化数据 +------------------+ | .rodata | ← 只读数据 +------------------+ | .text | ← 程序代码 低地址 ``` --- ### 四、验证实验 通过 `size` 命令查看各大小: ```bash # 编译测试程序 gcc -o test test.c # 查看信息 size test ``` 输出示例: ``` text data bss dec hex filename 1024 256 128 1408 580 test ``` --- ### 五、编程注意事项 1. **`.bss` 优化**:大型零初始化数组应声明为全局/静态变量 ```c static char big_buffer[1MB]; // 优于栈上声明(避免栈溢出) ``` 2. **`.rodata` 保护**:尝试修改只读数据段会导致错误 3. **`.data` 初始化**:显式初始化非零值变量会增大可执行文件体积 4. **多线程安全**:全局变量存储在`.data`/`.bss`中,需注意线程同步问题 通过 `objdump -h` 可查看更详细的信息,理解这些有助于进行内存优化和调试内存相关错误。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值