.bss段和.data段的区别

最新推荐文章于 2025-02-06 10:35:38 发布

转载最新推荐文章于 2025-02-06 10:35:38 发布 · 292 阅读

文章标签：

#汇编 #exe #float #file

C/C++ 专栏收录该内容

11 篇文章

订阅专栏

本文探讨了程序中BSS段与DATA段的区别及其对编译后EXE文件大小的影响。通过实例分析，展示了未初始化变量与已初始化变量在不同内存段的存储方式，解释了为何某些数组的存在会显著增加EXE文件的大小。

【例一】

用 cl 编译两个小程序如下：

程序 1:

int ar[30000];
void main()
{
......
}

程序 2:

int ar[300000] = {1, 2, 3, 4, 5, 6 };
void main()
{
......
}

发现程序 2 编译之后所得的 .exe 文件比程序 1 的要大得多。当下甚为不解，于是手工编译了一下，并使用了 /FA 编译选项来查看了一下其各自的 .asm ，发现在程序 1.asm 中 ar 的定义如下：

_BSS SEGMENT
?ar@@3PAHA DD 0493e0H DUP (?) ; ar
_BSS ENDS

而在程序 2.asm 中， ar 被定义为：

_DATA SEGMENT
     ?ar@@3PAHA DD 01H     ; ar
                DD 02H
                DD 03H
                ORG $+1199988
_DATA ENDS

区别很明显，一个位于 .bss 段，而另一个位于 .data 段，两者的区别在于：全局的未初始化变量存在于 .bss 段中，具体体现为一个占位符；全局的已初始化变量存于 .data 段中；而函数内的自动变量都在栈上分配空间。 .bss 是不占用 .exe 文件空间的，其内容由操作系统初始化（清零）；而 .data 却需要占用，其内容由程序初始化，因此造成了上述情况。

【例二】

编译如下程序（ test.cpp ） :
#include <stdio.h>

#define LEN 1002000

int inbss[LEN];
float fA;
int indata[LEN]={1,2,3,4,5,6,7,8,9};
double dbB = 100.0;

const int cst = 100;

int main(void)
{
    int run[100] = {1,2,3,4,5,6,7,8,9};
    for(int i=0; i<LEN; ++i)
        printf("%d ", inbss[i]);
    return 0;
}

命令： cl /FA test.cpp 回车 (/FA: 产生汇编代码 )
产生的汇编代码 (test.asm):
    TITLE   test.cpp
    .386P
include listing.inc
if @Version gt 510
.model FLAT
else
_TEXT   SEGMENT PARA USE32 PUBLIC 'CODE'
_TEXT   ENDS
_DATA   SEGMENT DWORD USE32 PUBLIC 'DATA'
_DATA   ENDS
CONST   SEGMENT DWORD USE32 PUBLIC 'CONST'
CONST   ENDS
_BSS   SEGMENT DWORD USE32 PUBLIC 'BSS'
_BSS   ENDS
_TLS   SEGMENT DWORD USE32 PUBLIC 'TLS'
_TLS   ENDS
FLAT   GROUP _DATA, CONST, _BSS
    ASSUME   CS: FLAT, DS: FLAT, SS: FLAT
endif
PUBLIC   ?inbss@@3PAHA                   ; inbss
PUBLIC   ?fA@@3MA                   ; fA
PUBLIC   ?indata@@3PAHA                   ; indata
PUBLIC   ?dbB@@3NA                   ; dbB
_BSS   SEGMENT
? inbss @@3PAHA DD 0f4a10H DUP (?)           ; inbss
?fA@@3MA DD   01H DUP (?)               ; fA
_BSS   ENDS
_DATA   SEGMENT
? indata @@3PAHA DD 01H                   ; indata
    DD   02H
    DD   03H
    DD   04H
    DD   05H
    DD   06H
    DD   07H
    DD   08H
    DD   09H
    ORG $+4007964
?dbB@@3NA DQ   04059000000000000r       ; 100   ; dbB
_DATA   ENDS
PUBLIC   _main
EXTRN   _printf:NEAR
_DATA   SEGMENT
$SG537   DB   '%d ', 00H
_DATA   ENDS
_TEXT   SEGMENT
_run$ = -400
_i$ = -404
_main   PROC NEAR
; File test.cpp
; Line 13
    push   ebp
    mov   ebp, esp
    sub   esp, 404               ; 00000194H
    push   edi
; Line 14
    mov   DWORD PTR _run$[ebp], 1
    mov   DWORD PTR _run$[ebp+4], 2
    mov   DWORD PTR _run$[ebp+8], 3
    mov   DWORD PTR _run$[ebp+12], 4
    mov   DWORD PTR _run$[ebp+16], 5
    mov   DWORD PTR _run$[ebp+20], 6
    mov   DWORD PTR _run$[ebp+24], 7
    mov   DWORD PTR _run$[ebp+28], 8
    mov   DWORD PTR _run$[ebp+32], 9
    mov   ecx, 91                   ; 0000005bH
    xor   eax, eax
    lea   edi, DWORD PTR _run$[ebp+36]
    rep stosd
; Line 15
    mov   DWORD PTR _i$[ebp], 0
    jmp   SHORT $L534
$L535:
    mov   eax, DWORD PTR _i$[ebp]
    add   eax, 1
    mov   DWORD PTR _i$[ebp], eax
$L534:
    cmp   DWORD PTR _i$[ebp], 1002000       ; 000f4a10H
    jge   SHORT $L536
; Line 16
    mov   ecx, DWORD PTR _i$[ebp]
    mov   edx, DWORD PTR ?inbss@@3PAHA[ecx*4]
    push   edx
    push   OFFSET FLAT:$SG537
    call   _printf
    add   esp, 8
    jmp   SHORT $L535
$L536:
; Line 17
    xor   eax, eax
; Line 18
    pop   edi
    mov   esp, ebp
    pop   ebp
    ret   0
_main   ENDP
_TEXT   ENDS
END
－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－
通过汇编文件可以看到，数组 inbss 和 indata 位于不同的段（ inbss 位于 bss 段，而 indata 位于 data 段）
若把 test.cpp 中的 indata 数组拿掉，查看生成的 exe 文件的大小，可以发现， indata 拿掉之后 exe 文件的大小小了很多。而若拿掉的是 inbss 数组， exe 文件大小跟没拿掉时相差无几。

说明了：
bss 段（未手动初始化的数据）并不给该段的数据分配空间，只是记录数据所需空间的大小。
data （已手动初始化的数据）段则为数据分配空间，数据保存在目标文件中。