为什么代码和数据要分开存放成代码段和数据段

本文探讨了汇编语言中将数据段与代码段合并在同一段内的优缺点,包括节省空间、提高编写效率及对程序清晰度的影响。同时详细解释了变量定义的位置要求及其对程序执行的影响。

原文地址:http://www.cnblogs.com/yeahwell/archive/2013/03/25/5226045.html

在百度里面看到这样一个问题和答案,记录一下。

汇编中把数据段和代码段定义在同一段内有好处么?
代码段和数据段的定义以及思考 悬赏分:10 -解决时间:2009-11-12 14:58
在汇编语言,把代码段和数据段放在同一段内,在伪指令
定义变量时位置有何要求么? 放在Start:后
还是Start前有没不同?
定义宏定义或子程序放在Start:(程序开始的标号)前后有影响?
好处是能让编译出来的程序节省几个字节的大小,另外能让你在写源码的时候少打几个字,因为不用弄数据段了嘛,
不过在写大程序的时候最好是把数据段和代码段分开,因为那样更清晰.当然如果你认为把数据和代码放在一起更清晰的话,你可以坚持自己的性格
恩,这个位置是非常讲究的

第一:在代码段中定义的数据不能定义到CS:IP可能碰到的地方,因为变量一旦被CS:IP碰到的话,就会把数据当成指令执行了.CPU很生气,后果很严重.例子:


正确的定义:
code segment
var01 db 64
start:
 mov ax,cx
 mov ds,ax
 mov al,var01
 mov ax,4C00H
 int 21H
 ;也可以把"var01 db 64"放在这行里,放在这里的话上面定义的数据就不能要了
 ;CPU在执行完int 21H之后CS:IP就飘到别的地方去了,所以不会执行到这里
code ends


错误的定义:
code segment
start:
 mov ax,cx
 mov ds,ax
var01 db 64 ;CPU在执行的时候会光顾这里,所以不能定义在这里
 mov al,var01
 mov ax,4C00H
 int 21H
code ends

第二:数据最好是定义在代码段的最前面或者最后面,让代码段的一部分是数据,一部分是代码,不然你如果一会是数据,一会是代码的话,看源码的人会很生气的.但这条可能有例外的情况,例子:

code segment
start:
 mov ax,cx
 mov ds,ax
 jmp OMG
var01 db 64 ;前一条指令会让CS:IP指向下面的那条指令
 ;如果你认为这样很美的话可以这么干
OMG:
 mov al,var01
 mov ax,4C00H
 int 21H
code ends

宏定义定义在哪我不知道有什么影响,不过一般好像都是定义在程序开头的

子程序定义在start前面或者
mov ax,4C00H
int 21H ;(也就是程序返回代码)
后面都一样
也可以通过前面那个例子里,用jmp弄出一段不会直接执行的空间,这样:
code segment
var01 db 64
start:
 mov ax,cx
 mov ds,ax
 jmp OMG1
OMG2:
 mov al,var01
 ret
OMG1:
 call OMG2
 mov ax,4C00H
 int 21H
code ends 
我感觉这种方法非常2,其实子程序应该放在一起,像这样:
code segment
var01 db 64
start:
 mov ax,cx
 mov ds,ax
 call OMG1
 call OMG2
 mov ax,4C00H
 int 21H
OMG1:
 mov al,var01
 ret
OMG2:
 xor al,al
 ret
code ends


代码和数据其实应该是一个样子的,分开的原因现在想到一个,就是CPU是顺序执行的(除了跳转指令外),然后如果取址的地方有数据,那就要发生错误了。还有就是如果大数据量的话,操作起来就很方便了,但是放到一起就会很麻烦。。。。。

### 代码段数据段、BSS段、堆、栈常量区的概念及用途 #### 一、代码段(Code Segment/Text Segment) 代码段是程序中存放指令的地方,通常包含编译后的机器代码。这一段通常是只读的,以防止程序意外地修改自身的指令[^3]。代码段的内容在程序运行期间不会改变,它主要由函数体指令组。 ```c void example_function() { // 函数体位于代码段 } ``` #### 二、数据段(Data Segment) 数据段用于存储已初始化的全局变量静态变量。这些变量在程序开始时被赋予初始值,并在整个程序运行期间保持存在[^5]。数据段分为两个部分:已初始化的数据段(Initialized Data Segment)未初始化的数据段(Uninitialized Data Segment,即BSS段)。 ```c int initialized_global = 10; // 已初始化的全局变量,位于数据段 ``` #### 三、BSS段(Block Started by Symbol) BSS段是未初始化的全局变量静态变量的存储区域。尽管这些变量没有显式初始化,但在程序启动时,系统会自动将它们初始化为零或空指针[^3]。BSS段并不占用实际的磁盘空间,因为它仅在内存中分配。 ```c int uninitialized_global; // 未初始化的全局变量,位于BSS段 ``` #### 四、堆(Heap) 堆是由程序员动态分配释放的内存区域,主要用于存储动态分配的数据结构,如数组、链表等。堆的大小可以根据需要增长或缩减。堆的管理通常通过 `malloc`、`calloc` `free` 等函数实现[^4]。 ```c int *dynamic_array = (int *)malloc(10 * sizeof(int)); // 动态分配数组,位于堆 ``` #### 五、栈(Stack) 栈是由编译器自动管理的内存区域,用于存储局部变量、函数参数返回地址等信息。栈的操作方式类似于数据结构中的栈,遵循后进先出(LIFO)原则。当函数调用结束时,栈上的内存会自动释放[^5]。 ```c void function_with_stack() { int local_variable; // 局部变量,位于栈 } ``` #### 六、常量区(Constant Segment) 常量区用于存储程序中定义的常量数据,如字符串字面量只读数据。这些数据在程序运行期间不可修改,通常与代码段一起加载到内存中。 ```c char *constant_string = "Hello, World!"; // 字符串字面量位于常量区 ``` --- ### 区别与联系 - **区别**: - **代码段**:只读,存储程序指令。 - **数据段**:存储已初始化的全局变量静态变量。 - **BSS段**:存储未初始化的全局变量静态变量,初始化为零。 - **堆**:动态分配,由程序员控制。 - **栈**:自动分配释放,用于局部变量函数调用。 - **常量区**:存储只读数据,如字符串字面量。 - **联系**: - 数据段BSS段可能在物理上连续,但逻辑上分开。 - 堆、BSS段数据段在物理内存中可能是连续的[^2]。 - 栈代码段独立存放,避免冲突[^2]。 ---
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值