bss、data和rodata区别与联系

本文详细介绍了全局内存中的bss、data和rodata三种类型的特点及应用,帮助开发者更好地理解全局内存,实现程序的空间与时间优化。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

转自:http://blog.youkuaiyun.com/laiqun_ai/article/details/8528366

有人可能会说,全局内存就是全局变量嘛,有必要专门一章来介绍吗?这么简单的东西,还能玩出花来?我从来没有深究它,不一样写程序吗?关于全局内存这个主题虽然玩不出花来,但确实有些重要,了解这些知识,对于优化程序的时间和空间很有帮助。因为有好几次这样经历,我才决定花一章篇幅来介绍它。


正如大家所知道的,全局变量是放在全局内存中的,但反过来却未必成立。用static修饰的局部变量就是放在放全局内存的,它的作用域是局部的,但生命期是全局的。在有的嵌入式平台中,堆实际上就是一个全局变量,它占用相当大的一块内存,在运行时,把这块内存进行二次分配。

这里我们并不强调全局变量和全局内存的差别。在本文中,全局强调的是它的生命期,而不是它的作用域,所以有时可能把两者的概念互换。

一般来说,在一起定义的两个全局变量,在内存的中位置是相邻的。这是一个简单的常识,但有时挺有用,如果一个全局变量被破坏了,不防先查查其前后相关变量的访问代码,看看是否存在越界访问的可能。

在ELF格式的可执行文件中,全局内存包括三种:bss、data和rodata。其它可执行文件格式与之类似。了解了这三种数据的特点,我们才能充分发挥它们的长处,达到速度与空间的最优化。

1.         bss
已经记不清bss代表Block Storage Start还是Block Started by Symbol。像这我这种没有用过那些史前计算机的人,终究无法明白这样怪异的名字,也就记不住了。不过没有关系,重要的是,我们要清楚bss全局变量有什么样特点,以及如何利用它。

通俗的说,bss是指那些没有初始化的和初始化为0的全局变量。它有什么特点呢,让我们来看看一个小程序的表现。
int bss_array[1024 * 1024] = {0};

int main(int argc, char* argv[])
{
    return 0;
}
[root@localhost bss]# gcc -g bss.c -o bss.exe
[root@localhost bss]# ll
total 12
-rw-r--r-- 1 root root   84 Jun 22 14:32 bss.c
-rwxr-xr-x 1 root root 5683 Jun 22 14:32 bss.exe

变量bss_array的大小为4M,而可执行文件的大小只有5K。 由此可见,bss类型的全局变量只占运行时的内存空间,而不占文件空间

另外,大多数操作系统,在加载程序时,会把所有的bss全局变量全部清零,无需要你手工去清零。但为保证程序的可移植性,手工把这些变量初始化为0也是一个好习惯。

2.         data
与bss相比,data就容易明白多了,它的名字就暗示着里面存放着数据。当然如果数据全是零,为了优化考虑,编译器把它当作bss处理。通俗的说,data指那些初始化过(非零)的非const的全局变量。它有什么特点呢,我们还是来看看一个小程序的表现。
int data_array[1024 * 1024] = {1};

int main(int argc, char* argv[])
{
    return 0;
}

[root@localhost data]# gcc -g data.c -o data.exe
[root@localhost data]# ll
total 4112
-rw-r--r-- 1 root root      85 Jun 22 14:35 data.c
-rwxr-xr-x 1 root root 4200025 Jun 22 14:35 data.exe

仅仅是把初始化的值改为非零了,文件就变为4M多。由此可见,data类型的全局变量是即占文件空间,又占用运行时内存空间的。

3.         rodata
rodata
的意义同样明显,ro代表read only,即只读数据(const)。关于rodata类型的数据,要注意以下几点:
l         常量不一定就放在rodata里,有的立即数直接编码在指令里,存放在代码段(.text)中。
l         对于字符串常量,编译器会自动去掉重复的字符串,保证一个字符串在一个可执行文件(EXE/SO)中只存在一份拷贝。
l         rodata是在多个进程间是共享的,这可以提高空间利用率。
l         在有的嵌入式系统中,rodata放在ROM(如norflash)里,运行时直接读取ROM内存,无需要加载到RAM内存中。
l         在嵌入式linux系统中,通过一种叫作XIP(就地执行)的技术,也可以直接读取,而无需要加载到RAM内存中。

由此可见,把在运行过程中不会改变的数据设为rodata类型的,是有很多好处的:在多个进程间共享,可以大大提高空间利用率,甚至不占用RAM空间。同时由于rodata在只读的内存页面(page)中,是受保护的,任何试图对它的修改都会被及时发现,这可以帮助提高程序的稳定性。

4.         变量与关键字
static关键字用途太多,以致于让新手模糊。不过,总结起来就有两种作用,改变生命期限制作用域。如:
l         修饰inline函数:限制作用域
l         修饰普通函数:限制作用域
l         修饰局部变量:改变生命期
l         修饰全局变量:限制作用域

const 关键字倒是比较明了,用const修饰的变量放在rodata里,字符串默认就是常量。对const,注意以下几点就行了。
l         指针常量:指向的数据是常量。如 const char* p = “abc”; p指向的内容是常量 ,但p本身不是常量,你可以让p再指向”123”。
l         常量指针:指针本身是常量。如:char* const p = “abc”; p本身就是常量,你不能让p再指向”123”。
l         指针常量 + 常量指针:指针和指针指向的数据都是常量。const char* const p =”abc”; 两者都是常量,不能再修改。

violatile关键字通常用来修饰多线程共享的全局变量和IO内存。告诉编译器,不要把此类变量优化到寄存器中,每次都要老老实实的从内存中读取,因为它们随时都可能变化。这个关键字可能比较生僻,但千万不要忘了它,否则一个错误让你调试好几天也得不到一点线索。
<think>好的,用户现在问的是关于C语言中.data、.bss、.text.rodata这几个段的问题。我需要先回忆一下这些段各自的作用区别。 首先,用户之前问了如何定头文件路径编译,现在转向目标文件的结构,可能是在学习编译链接过程或者底层的内存管理。用户可能是刚开始学习C语言,或者是想更深入了解程序的内存布局。需要以简明的方式解释每个段的作用,同时出它们的区别实际应用。 接下来,我要确保每个段的解释准确无误。.text段是存放可执行代码的,通常是只读的。.data段存放已初始化的全局静态变量,而.bss段则是未初始化的,或者初始化为0的全局静态变量,这里要注意区分初始化未初始化的区别。.rodata是只读数据,比如字符串常量const变量。此外,还要提到这些段在内存中的位置,比如.text.rodata通常是只读的,防止程序意外修改。 用户可能需要例子来理解,比如用代码示例说明不同变量存放在哪个段。比如全局变量初始化未初始化的例子,静态变量的例子,以及const修饰的变量是否进入.rodata。同时,要提到.bss段在目标文件中不占空间,但在运行时分配内存,这样可以节省磁盘空间。 还要考虑用户可能的误区,比如未初始化的静态变量是否属于.bss,或者const变量的存储位置是否因编译器而异。需要出这些细节,帮助用户正确理解。 最后,总结各个段的区别,用表格或对比的方式,让用户一目了然。同时,可以提到实际应用中的注意事项,比如优化代码体积或内存使用时的考虑因素,比如将大型未初始化数组放在.bss段可以减小可执行文件的大小。 需要确保语言通俗易懂,避免过于技术化的术语,但也要准确。可能用户在学习过程中遇到链接错误或者内存问题,理解这些段有助于调试。因此,强调这些段在程序运行中的作用影响,帮助用户在实际编程中应用这些知识。</think>在C程序的内存布局中,`.data`、`.bss`、`.text``.rodata`是目标文件中的关键段(section),其作用如下: --- ### 一、核心作用对照表 | 段名称 | 存储内容 | 内存特性 | 初始状态 | |-----------|-----------------------------------|----------------|----------------| | `.text` | **可执行代码** | 只读 | 编译时确定 | | `.rodata` | **只读数据**(字符串常量、const变量) | 只读 | 编译时写入 | | `.data` | **已初始化的全局/静态变量** | 可读写 | 运行时加载初始值 | | `.bss` | **未初始化或零初始化的全局/静态变量** | 可读写 | 运行时清零 | --- ### 二、详细说明 #### 1. `.text` 代码段 - **存储内容**:编译后的机器令 - **特性**: - 多个进程可共享同一份代码 - 具有**执行权限**但**不可写** - **示例**: ```c void func() { // 函数体代码存储在此段 int x = 10; } ``` #### 2. `.rodata` 只读数据段 - **存储内容**: - 字符串字面量 `"Hello World"` - `const` 修饰的全局变量 - `switch-case` 跳转表 - **特殊限制**: ```c const int MAX = 100; // 进入.rodata char* ptr = "ReadOnly"; // 字符串本身在.rodata ``` #### 3. `.data` 数据段 - **存储内容**: - 显式初始化的全局变量 - 显式初始化的静态变量 - **特点**: - 占用磁盘空间(存储初始值) - 程序加载时复制到内存 - **示例**: ```c int initialized = 42; // 全局变量 static float pi = 3.14f; // 静态变量 ``` #### 4. `.bss` 未初始化段 - **存储内容**: - 未初始化的全局/静态变量 - 零初始化的全局/静态变量 - **优势**: - **不占用磁盘空间**(仅记录内存大小) - 程序加载时自动填充零 - **示例**: ```c int uninitialized; // 进入.bss static char buffer[1024]; // 进入.bss int zero = 0; // 零初始化也进.bss ``` --- ### 三、内存布局示例 ``` 高地址 +------------------+ | 栈(stack) | | ↓ 生长方向 | +------------------+ | 堆(heap) | | ↑ 生长方向 | +------------------+ | .bss | ← 未初始化数据 +------------------+ | .data | ← 已初始化数据 +------------------+ | .rodata | ← 只读数据 +------------------+ | .text | ← 程序代码 低地址 ``` --- ### 四、验证实验 通过 `size` 命令查看各段大小: ```bash # 编译测试程序 gcc -o test test.c # 查看段信息 size test ``` 输出示例: ``` text data bss dec hex filename 1024 256 128 1408 580 test ``` --- ### 五、编程注意事项 1. **`.bss` 段优化**:大型零初始化数组应声明为全局/静态变量 ```c static char big_buffer[1MB]; // 优于栈上声明(避免栈溢出) ``` 2. **`.rodata` 保护**:尝试修改只读数据段会导致段错误 3. **`.data` 初始化**:显式初始化非零值变量会增大可执行文件体积 4. **多线程安全**:全局变量存储在`.data`/`.bss`中,需注意线程同步问题 通过 `objdump -h` 可查看更详细的段信息,理解这些段有助于进行内存优化调试内存相关错误。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值