x86 CS IP

[CS IP]

2.10  CS和IP(1)

CS和IP是8086CPU中两个最关键的寄存器,它们指示了CPU当前要读取指令的地址。CS为代码段寄存器,IP为指令指针寄存器,从名称上我们可以看出它们和指令的关系。

在8086PC机中,任意时刻,设CS中的内容为M,IP中的内容为N,8086CPU将从内存M 16+N单元开始,读取一条指令并执行。

也可以这样表述:8086机中,任意时刻,CPU将CS:IP指向的内容当作指令执行。

图2.10展示了8086CPU读取、执行指令的工作原理(图中只包括了和所要说明的问题密切相关的部件,图中数字都为十六进制)。

 
图2.10  8086PC读取和执行指令的相关部件

图2.10说明如下。

(1) 8086CPU当前状态:CS中的内容为2000H,IP中的内容为0000H;

(2) 内存20000H~20009H单元存放着可执行的机器码;

(3) 内存20000H~20009H单元中存放的机器码对应的汇编指令如下。

地址:20000H~20002H,内容:B8 23 01,长度:3Byte,对应汇编指令:mov ax,0123H

地址:20003H~20005H,内容:BB 03 00,长度:3Byte,对应汇编指令:mov bx,0003H

地址:20006H~20007H,内容:89 D8,长度:2Byte,对应汇编指令:mov ax,bx

地址:20008H~20009H,内容:01 D8,长度:2Byte,对应汇编指令:add ax,bx

下面的一组图(图2.11~图2.19),以图2.10描述的情况为初始状态,展示了8086CPU读取、执行一条指令的过程。注意每幅图中发生的变化(下面对8086CPU的描述,是在逻辑结构、宏观过程的层面上进行的,目的是使读者对CPU工作原理有一个清晰、直观的认识,为汇编语言的学习打下基础。其中隐蔽了CPU的物理结构以及具体的工作细节)。

 
图2.11  初始状态(CS:2000H,IP:0000H,CPU将从
内存2000H×16+0000H处读取指令执行)
 
图2.12  CS、IP中的内容送入地址加法器(地址加法
器完成:物理地址=段地址×16+偏移地址)

 
图2.13  地址加法器将物理地址送入输入输出控制电路
 
图2.14  输入输出控制电路将物理地址20000H送上地址总线
 
图2.15  从内存20000H单元开始存放的
机器指令B8 23 01通过数据总线被送入CPU
 
图2.16  输入输出控制电路将机器指令B8 23 01送入指令缓冲器
 
图2.17  IP中的值自动增加

(读取一条指令后,IP中的值自动增加,以使CPU可以读取下一条指令。因当前读入的指令B82301

长度为3个字节,所以IP中的值加3。此时,CS:IP指向内存单元2000:0003。)

2.10 CS和IP(2)

 
图2.18  执行控制器执行指令B8 23 01(即mov ax,0123H)

 
图2.19  指令B8 23 01被执行后AX中的内容为0123H

(此时,CPU将从内存单元2000:0003处读取指令。)

下面的一组图(图2.20~图2.26),以图2.19的情况为初始状态,展示了8086CPU继续读取、执行3条指令的过程。注意IP的变化(下面的描述中,隐蔽了读取每条指令的细节)。

 
图2.20  CS:2000H,IP:0003H(CPU将从内存2000H×16+0003H处读取指令BB 03 00)

 
图2.21  CPU从内存20003H处读取指令BB 03 00入指令缓冲器(IP中的值加3)

 
图2.22  执行指令BB 03 00(即mov bx,0003H)

 
图2.23  CPU从内存20006H处读取指令89 D8入指令缓冲器(IP中的值加2)

 

 
图2.24  执行指令89 D8(即mov ax,bx)后,AX中的内容为0003H

 
图2.25  CPU从内存20008H处读取指令01 D8入指令缓冲器(IP中的值加2)

 
图2.26  执行指令01 D8(即add ax,bx)后,AX中的内容为0006H

通过上面的过程展示,8086CPU的工作过程可以简要描述如下。

(1) 从CS:IP指向的内存单元读取指令,读取的指令进入指令缓冲器;

(2) IP=IP+所读取指令的长度,从而指向下一条指令;

(3) 执行指令。转到步骤(1),重复这个过程。

在8086CPU加电启动或复位后(即CPU刚开始工作时)CS和IP被设置为CS=FFFFH,IP=0000H,即在8086PC机刚启动时,CPU从内存FFFF0H单元中读取指令执行,FFFF0H单元中的指令是8086PC机开机后执行的第一条指令。

现在,我们更清楚了CS和IP的重要性,它们的内容提供了CPU要执行指令的地址。

我们在第1章中讲过,在内存中,指令和数据没有任何区别,都是二进制信息,CPU在工作的时候把有的信息看作指令,有的信息看作数据。现在,如果提出一个问题:CPU根据什么将内存中的信息看作指令?如何回答?我们可以说,CPU将CS:IP指向的内存单元中的内容看作指令,因为,在任何时候,CPU将CS、IP中的内容当作指令的段地址和偏移地址,用它们合成指令的物理地址,到内存中读取指令码,执行。如果说,内存中的一段信息曾被CPU执行过的话,那么,它所在的内存单元必然被CS:IP指向过。

2.11  修改CS、IP的指令

在CPU中,程序员能够用指令读写的部件只有寄存器,程序员可以通过改变寄存器中的内容实现对CPU的控制。CPU从何处执行指令是由CS、IP中的内容决定的,程序员可以通过改变CS、IP中的内容来控制CPU执行目标指令。

我们如何改变CS、IP的值呢?显然,8086CPU必须提供相应的指令。我们如何修改AX中的值?可以用mov指令,如mov ax,123将ax中的值设为123,显然,我们也可以用同样的方法设置其他寄存器的值,如mov bx,123,mov cx,123,mov dx,123等。其实,8086CPU大部分寄存器的值,都可以用mov指令来改变,mov指令被称为传送指令。

但是,mov指令不能用于设置CS、IP的值,原因很简单,因为8086CPU没有提供这样的功能。8086CPU为CS、IP提供了另外的指令来改变它们的值。能够改变CS、IP的内容的指令被统称为转移指令(我们以后会深入研究)。我们现在介绍一个最简单的可以修改CS、IP的指令:jmp指令。

若想同时修改CS、IP的内容,可用形如"jmp段地址:偏移地址"的指令完成,如

jmp 2AE3:3,执行后:CS=2AE3H,IP=0003H,CPU将从2AE33H处读取指令。

jmp 3:0B16,执行后:CS=0003H,IP=0B16H,CPU将从00B46H处读取指令。

"jmp 段地址:偏移地址"指令的功能为:用指令中给出的段地址修改CS,偏移地址修改IP。

若想仅修改IP的内容,可用形如"jmp 某一合法寄存器"的指令完成,如

jmp ax,指令执行前:ax=1000H,CS=2000H,IP=0003H
指令执行后:ax=1000H,CS=2000H,IP=1000H
jmp bx,指令执行前:bx=0B16H,CS=2000H,IP=0003H
指令执行后:bx=0B16H,CS=2000H,IP=0B16H

"jmp 某一合法寄存器"指令的功能为:用寄存器中的值修改IP。

jmp ax,在含义上好似:mov IP,ax。

注意,我们在适当的时候,会用已知的汇编指令的语法来描述新学的汇编指令的功能。采用一种"用汇编解释汇编"的方法来使读者更好地理解汇编指令的功能,这样做有助于读者进行知识的相互融会。要强调的是,我们是用"已知的汇编指令的语法"进行描述,并不是用"已知的汇编指令"来描述,比如,我们用mov IP,ax来描述jmp ax,并不是说真有mov IP,ax这样的指令,而是用mov指令的语法来说明jmp指令的功能。我们可以用同样的方法描述jmp 3:01B6的功能:jmp 3:01B6 在含义上好似mov CS,3  mov IP,01B6。

内存中存放的机器码和对应的汇编指令情况如图2.27所示,设CPU初始状态:CS=2000H,IP=0000H,请写出指令执行序列。思考后看分析。

 
图2.27  内存中存放的机器码和对应的汇编指令

分析:

CPU对图2.27中的指令的执行过程如下。

(1) 当前CS=2000H,IP=0000H,则CPU从内存2000H×16+0=20000H处读取指令,读入的指令是:B8 22 66(mov ax,6622H),读入后IP=IP+3=0003H;

(2) 指令执行后,CS=2000H,IP=0003H,则CPU从内存2000H×16+0003H =20003H处读取指令,读入的指令是:EA 03 00 00 10(jmp 1000:0003),读入后IP=IP+5=0008H;

(3) 指令执行后,CS=1000H,IP=0003H,则CPU从内存1000H×16+0003H =10003H处读取指令,读入的指令是:B8 00 00(mov ax,0000),读入后IP=IP+3=0006H;

(4) 指令执行后,CS=1000H,IP=0006H,则CPU从内存1000H×16+0006H =10006H处读取指令,读入的指令是:8B D8(mov bx,ax),读入后IP=IP+2=0008H;

(5) 指令执行后,CS=1000H,IP=0008H,则CPU从内存1000H×16+0008H =10008H处读取指令,读入的指令是:FF E3(jmp bx),读入后IP=IP+2=000AH;

(6) 指令执行后,CS=1000H,IP=0000H,CPU从内存10000H处读取指令……

经分析后,可知指令执行序列为:

(1) mov ax,6622H

(2) jmp 1000:3

(3) mov ax,0000

(4) mov bx,ax

(5) jmp bx

(6) mov ax,0123H

(7) 转到第3步执行

2.12  代码段(1)

前面讲过,对于8086PC机,在编程时,可以根据需要,将一组内存单元定义为一个段。我们可以将长度为N(N≤64KB)的一组代码,存在一组地址连续、起始地址为16的倍数的内存单元中,我们可以认为,这段内存是用来存放代码的,从而定义了一个代码段。比如,将:

mov ax,0000   (B8 00 00)
add ax,0123   (05 23 01)
mov bx,ax     (8B D8)
jmp bx         (FF E3)

这段长度为10个字节的指令,存放在123B0H~123B9H的一组内存单元中,我们就可以认为,123B0H~123B9H这段内存是用来存放代码的,是一个代码段,它的段地址为123BH,长度为10个字节。

如何使得代码段中的指令被执行呢?将一段内存当作代码段,仅仅是我们在编程时的一种安排,CPU并不会由于这种安排,就自动地将我们定义的代码段中的指令当作指令来执行。CPU只认被CS:IP指向的内存单元中的内容为指令。所以,要让CPU执行我们放在代码段中的指令,必须要将CS:IP指向所定义的代码段中的第一条指令的首地址。对于上面的例子,我们将一段代码存放在123B0H~123B9H内存单元中,将其定义为代码段,如果要让这段代码得到执行,可设CS=123BH、IP=0000H。

2.9~2.12  小结

(1) 段地址在8086CPU的段寄存器中存放。当8086CPU要访问内存时,由段寄存器提供内存单元的段地址。8086CPU有4个段寄存器,其中CS用来存放指令的段地址。

(2) CS存放指令的段地址,IP存放指令的偏移地址。

8086机中,任意时刻,CPU将CS:IP指向的内容当作指令执行。

(3) 8086CPU的工作过程:

① 从CS:IP指向的内存单元读取指令,读取的指令进入指令缓冲器;

② IP指向下一条指令;

③ 执行指令。(转到步骤①,重复这个过程。)

(4) 8086CPU提供转移指令修改CS、IP的内容。

检测点2.3

下面的3条指令执行后,CPU几次修改IP?都是在什么时候?最后IP中的值是多少?

mov ax,bx
sub ax,ax
jmp ax

实验1  查看CPU和内存,用机器指令和汇编指令编程

1. 预备知识:Debug的使用

我们以后所有的实验中,都将用到Debug程序,首先学习一下它的主要用法。

(1) 什么是Debug?

Debug是DOS、Windows都提供的实模式(8086方式)程序的调试工具。使用它,可以查看CPU各种寄存器中的内容、内存的情况和在机器码级跟踪程序的运行。

(2) 我们用到的Debug功能。

用Debug的R命令查看、改变CPU寄存器的内容;
用Debug的D命令查看内存中的内容;
用Debug的E命令改写内存中的内容;
用Debug的U命令将内存中的机器指令翻译成汇编指令;
用Debug的T命令执行一条机器指令;
用Debug的A命令以汇编指令的格式在内存中写入一条机器指令。

Debug的命令比较多,共有20多个,但这6个命令是和汇编学习密切相关的。在以后的实验中,我们还会用到一个P命令。

(3) 进入Debug。

Debug是在DOS方式下使用的程序。我们在进入Debug前,应先进入到DOS方式。用以下方式可以进入DOS。

① 重新启动计算机,进入DOS方式,此时进入的是实模式的DOS。

② 在Windows中进入DOS方式,此时进入的是虚拟8086模式的DOS。

下面说明在Windows 2000中进入Debug的一种方法,在Windows 98中进入的方法与此类似。

选择【开始】菜单中的【运行】命令,如图2.28所示,打开【运行】对话框,如图2.29所示,在文本框中输入"command"后,单击【确定】按钮。

 
图2.28  选择【运行】命令
 
图2.29  在文本框中输入"command"
进入DOS方式后,如果显示为窗口方式,可以按下Alt+Enter键将窗口变为全屏方式。然后运行Debug程序,如图2.30所示,这个程序在Windows 98中通常在c:/windows98/command下,在Windows 2000中通常在c:/winnt/system下。由于系统指定了搜索路径,所以在任何一个路径中都可以运行。

 
图2.30  运行Debug程序

(4) 用R命令查看、改变CPU寄存器的内容。

我们已经知道了AX、BX、CX、DX、CS、IP这6个寄存器,现在看一下它们之中的内容,如图2.31所示。其他寄存器如SP、BP、SI、DI、DS、ES、SS、标志寄存器等我们先不予理会。

 
图2.31  使用R命令查看CPU中各个寄存器中的内容

注意CS和IP的值,CS=0CA2,IP=0100,也就是说,内存0CA2:0100处的指令为CPU当前要读取、执行的指令。在所有寄存器的下方,Debug还列出了CS:IP所指向的内存单元处所存放的机器码,并将它翻译为汇编指令。可以看到,CS:IP所指向的内存单元为0CA2:0100,此处存放的机器码为02 75 48,对应的汇编指令为ADD DH,[DI+48](这条指令的含义我们还不知道,先不必深究)。

Debug输出的右下角还有一个信息:"DS:0048=0",我们以后会进行说明,这里同样不必深究。

<think>好的,我现在需要处理一个关于x86架构技术细节的查询。用户明确要求了解x86架构的相关信息或其技术细节,特别是技术细节的介绍。首先,我需要回顾已有的引用内容,确保回答准确并符合用户需求。 首先查看用户提供的三个引用: 引用[1]提到x86-32位架构的历史,包括IA-32、i386等术语,以及Intel 80386处理器的信息。这部分可能涉及寄存器结构和历史发展。 引用[2]比较了x86和ARM架构,提到了CISC与RISC的区别,以及查看系统架构的方法。这可能对对比x86特点有帮助,但用户更关注技术细节,所以可能重点不在比较。 引用[3]详细描述了8086处理器的结构,包括数据单元(通用寄存器如AX、BX等)、控制单元(IP寄存器、段寄存器CS、DS等)以及内存寻址方式。这部分内容详细,适合作为技术细节的核心。 用户的问题集中在技术细节,因此需要深入讨论x86架构的寄存器结构、内存管理、指令集特点等。根据引用[3],8086的结构是经典案例,可以作为切入点。需要解释通用寄存器的作用,如AX分为AH和AL,以及段寄存器的功能(CS、DS、SS等),IP寄存器的作用。同时,内存寻址方式如段基址加偏移量的机制需要说明。 此外,可能需要补充x86架构的发展,如从16位到32位再到64位的演变,以及现代x86处理器的特性,如流水线、超标量架构、多核技术等。但引用中没有提到这些,是否需要加入?用户的问题允许技术细节的扩展,但应基于现有引用尽可能回答,避免引入未引用的内容,除非必要。不过引用[1]提到了32位x86架构,可以提到80386引入的32位扩展,如扩展的寄存器(EAX等)和保护模式。 另外,需要注意用户可能对x86的指令集类型(CISC)感兴趣,引用[2]提到CISC vs RISC,可以简要说明x86作为CISC架构的特点,如复杂指令、可变长度指令等。 总结回答结构: 1. 寄存器结构:通用寄存器、段寄存器、指令指针。 2. 内存管理:分段机制,段基址加偏移量。 3. 指令集特点:CISC,指令格式。 4. 发展历程:从16位到32位(80386),64位扩展。 5. 其他技术:流水线、多核等(可能需简要提及,但引用有限)。 需要确保使用正确的LaTeX格式,行内公式用$...$,独立公式用$$...$$。例如,内存地址计算可以用公式表示:段基址*16 + 偏移量 = 物理地址。 另外,用户要求生成相关问题,需围绕x86的技术细节展开,如寄存器作用、寻址方式、架构发展等。 现在检查是否有遗漏或错误: - 是否准确描述段寄存器和内存寻址?根据引用[3],是的。 - 是否需要提到保护模式和虚拟内存?引用中没有,但80386引入保护模式,可能需简要提及。 - 指令格式如可变长度,操作码和ModR/M字节,可以加入技术细节,但引用未提供,可能需要避免推测。 应基于现有引用,确保信息准确,不添加未经引用的内容。如果引用中没有的内容,尽量不涉及或注明来源可能不详细。 现在组织回答: 1. 寄存器结构:详细说明通用寄存器(AX等)、段寄存器(CS、DS等)、IP寄存器。 2. 内存分段机制:物理地址计算方式,段基址左移4位加偏移量。 3. 指令集特点:CISC,引用[2]的比较。 4. 架构发展:16位到32位(80386),寄存器扩展如EAX。 5. 其他技术:流水线、超标量(如果引用允许,但可能需略过)。 在回答中适当加入LaTeX公式,例如: 物理地址计算:$$ \text{物理地址} = \text{段基址} \times 16 + \text{偏移量} $$ 最后,生成相关问题,如关于寄存器作用、分段机制、x86与ARM区别、性能优化等。</think>### x86架构技术细节详解 x86架构是计算机处理器领域的主流架构之一,其技术细节可从寄存器结构、内存管理、指令集特点及发展历程等方面展开。 #### 1. 寄存器结构 x86架构的寄存器分为**通用寄存器**、**段寄存器**和**控制寄存器**: - **通用寄存器**:早期8086处理器包含8个16位寄存器,包括$AX$、$BX$、$CX$、DX$,以及$SP$(栈指针)、$BP$(基址指针)、$SI$(源索引)、$DI$(目的索引)。其中$AX$、$BX$、$CX$、$DX$可拆分为高8位(如$AH$)和低8位(如$AL$)使用[^3]。 - **段寄存器**:包括$CS$(代码段)、$DS$(数据段)、$SS$(栈段)、$ES$(附加段),用于内存分段管理。每个段寄存器存储段的基地址,结合偏移量计算物理地址[^3]。 - **控制寄存器**:$IP$(指令指针)指向下一条待执行指令的偏移地址,$FLAGS$记录运算状态(如零标志、进位标志)[^3]。 #### 2. 内存分段机制 x86采用**分段内存模型**,物理地址通过以下公式计算: $$ \text{物理地址} = \text{段基址} \times 16 + \text{偏移量} $$ 例如,若$CS=0x1000$,$IP=0x0040$,则代码段的物理地址为$0x10000 + 0x0040 = 0x10040$[^3]。 #### 3. 指令集特点 x86属于**复杂指令集(CISC)**,特点包括: - **可变长度指令**:指令长度从1字节到15字节不等。 - **丰富寻址模式**:支持立即数、寄存器、直接/间接内存寻址等。 - **专用指令**:如字符串操作指令(`MOVSB`)、栈操作指令(`PUSH`/`POP`)[^3][^2]。 #### 4. 架构发展 - **16位到32位**:Intel 80386(i386)扩展为32位架构,引入保护模式,支持虚拟内存和多任务。通用寄存器扩展为$EAX$、$EBX$等,段寄存器新增$FS$、$GS$[^1][^3]。 - **64位扩展**:x86-64(AMD64)进一步扩展寄存器至64位(如$RAX$),并增加通用寄存器数量(R8-R15)。 #### 5. 现代技术优化 现代x86处理器融合了RISC特性,如: - **流水线技术**:指令并行处理以提高吞吐量。 - **超标量架构**:多执行单元同时处理指令。 - **多核集成**:单个芯片集成多个CPU核心。 ```assembly ; 示例:32位x86汇编代码(计算两个数之和) section .data num1 dd 10 num2 dd 20 section .text global _start _start: mov eax, [num1] ; 将num1加载到EAX add eax, [num2] ; EAX += num2 mov ebx, eax ; 结果存入EBX ```
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值