目录
-
计算机是进行数据处理、运算的机器,那么有两个基本问题包含在其中,在机器指令中必须给以明确或隐含的说明,否则计算机就无法工作:
- (1)处理的数据在什么地方?
- (2)要处理的数据有多长?
8.1 bx、si、di 和 bp
在8086CPU中,只有4个寄存器可用用在“[…]”中来进行内存的单元的寻址:bx、si、di、bp
。
错误示范:
mov ax,[cx]
mov ax,[ax]
mov ax,[dx]
mov ax,[ds]
在[…]中,这4个寄存器可以单个出现,或只能以4种组合出现:bx和si、bx和di、bp和si、bp和di
。
错误示范:
mov ax,[bx+bp]
mov ax,[si+di]
只要在[....]中使用寄存器bp,而指令中没有显性的给出段地址,段地址就默认在ss中
。
8086CPU在[…]中只能出现这4个寄存器,而且只能有这4中组合,让我挺意外的,之前没系统的学习汇编,但懂一些基础的汇编指令,查一些资料难免要看一些简单的汇编指令,当时就有疑问,为什么都喜欢对着ax寄存器反复存取数据,就不能用用其他寄存器,看了这些天汇编终于懂了,寄存器在一些指令中有特殊作用。
8.2 机器指令处理的数据在什么地方
绝大部分机器指令都是进行数据处理的指令,处理大致可分为3类:读取、写入、运算
。在机器指令这一层来讲,并不关心数据的值是多少,而关心指令执行前一刻,它将要处理的数据所在的位置。指令执行前,所要处理的数据可以在3个地方:CPU内部、内存、端口
(端口将在后面的课程中讨论)
8.3 汇编语言中数据位置的表达
-
汇编语言用3个概念来表达数据位置:
- 立即数(idata): 对于直接包含在机器指令中的数据(执行前在CPU的指令缓冲器中),汇编语言中称为立即数,在汇编指令中直接给出。
- 寄存器: 指令要处理的数据在寄存器中,在汇编指令中给出相应的寄存器名。
- 段地址(SA)和偏移地址(EA): 指令要处理的数据在内存中,在汇编指令中可用[X]的格式给出EA,SA在某个段寄存器中。存放段地址的寄存器可以是默认的,也可以显性给出。
8.4 寻址方式
-
当数据存放在内存时,我们可以用多种方式来给定这个内存单元的偏移地址,这种定位内存单元的方法一般被称为寻址方式:
- 直接寻址:[idata]
- 寄存器间接寻址:[bx]、[si]、[di]、[bp]
- 寄存器相对寻址:[bx+idata]、[si+idata]、[di+idata]、[bp+idata]
- 基址变址寻址:[bx+si]、[bx+di]、[bp+si]、[bp+di]
- 相对基址变址寻址:[bx+si+idata]、[bx+di+idata]、[bp+si+idata]、[bp+di+idata]
8.5 指令要处理的数据有多长
-
8086CPU的指令,可以处理两种尺寸的数据,byte和word。所以在机器指令中要指明,指令进行的是字操作还是字节操作。
- (1)通过寄存器名指明要处理的数据的尺寸。
- (2)在没有寄存器名存在的情况下,用操作符 X ptr 指明内存单元的长度,X在汇编指令中可以为word或byte。
在没有寄存器参与的内存单元访问指令中,用word ptr或byte ptr显性地指明所要访问的内存单元长度是很必要的
。否则,CPU无法得知所要访问的单元是字单元,还是字节单元。
有些指令默认了访问的是字单元还是字节单元,比如push、pop默认了访问的是字单元。
8.6 寻址方式的综合应用
8086CPU提供的如[bx+si+idata]的寻址方式为结构化数据的处理提供了方便。使得我们可以在编程的时候,从结构化的角度去看待所要处理的数据。一个结构化的数据包含了多个数据项,而数据项的类型又不相同,有的是字型数据,有的是字节型数据,有的是数组(字符串)。一般来说,我们可以用[bx+idata+si]的方式来访问结构体中的数据。用bx定位整个结构体,用idata定位结构体中的某一数据项,用si定位数据项中的每个元素。为此汇编语言提供了更为贴切的书写方式,如:[bx].data、[bx].idata[si]。
学了这一小节,我知道了,以前我写java程序时,数据都是瞎定义,只会根据是字符、布尔值,还是数字、数字长度、数字是不是浮点型,这些表面的东西来定义,或者说复杂的结构化的数据考虑,已经被水平更高的人规划好了,我只需要在别人框架下,写点增删改查。
8.7 div 指令
-
div 是除法指令,使用div做除法的时候应该注意以下问题:
- (1) 除数: 有8位和16位两种,在一个寄存器或内存单元中。
-
(2)
被除数: 默认放在AX或DX和AX中,如果除数为8位,被除数则位16位,默认在AX中存放;
如果除数为16位,被除数则为32位,在DX和AX中存放,DX存放高16位,AX存放低16位
。 -
(3)
结果:
如果除数为8位,则AL存储除法操作的商,AH存储除法操作的余数;如果除数为16位,则AX存储除法操作的商,DX存储除法操作的余数。
格式:div reg(寄存器);div 内存单元
32位的被除数分别放在DX和AX两个寄存器时,需要注意一下,十进制先转化为十六进制,高16位放DX,低16位放AX。
在分析后面的实验7时,突然想明白一个问题:
这一小节举得例子,之所以需要你手动将十进制数转换为十六进制,然后再传送给DX、AX寄存器,是因为例子中是对立即数操作。如果你通过dd伪指令在内存中定义一个双字型数字,然后通过mov指令将低两字节传送给AX,高两字节传送给DX,就不需要自己计算了。
8.8 伪指令 dd
db 和 dw 定义字节型数据和字型数据。dd 是用来定义 dword(double word,双字)型数据的。
8.9 dup
dup 是一个操作符,在汇编语言中同db、dw、dd等一样,也是由编译器识别处理的符号。
它是和db、dw、dd等数据定义伪指令配合使用的,用来进行数据的重复。
db 重复次数 dup(重复的字节型数据)
dw 重复次数 dup(重复的字型数据)
dd 重复次数 dup(重复的双字节型数据)
实验7 寻址方式在结构化数据访问中的应用
-
这是学到现在写得最难的一个汇编程序,构思了一个小时写好了,语法上犯了些错误,如下:
- mov指令的两个操作数不能都是内存单元。想想也是执行一条指令,取指令访存一次,再访存两次取两个操作数,效率太低。
-
div指令的操作数(除数),不能是立即数(idata),只能是保存在寄存器或内存单元中。
水平有限,个人代码仅供参考:
assume cs:code,ds:data,es:table,ss:stack
data segment
db '1975','1976','1977','1978','1979','1980','1981','1982','1983'
db '1984','1985','1986','1987','1988','1989','1990','1991','1992'
db '1993','1994','1995'
dd 16,22,382,1356,2390,8000,16000,24486,50065,97479,140417,197514
dd 345980,590827,803530,1183000,1843000,2759000,3753000,4649000,5937000
dw 3,7,9,13,28,38,130,220,476,778,1001,1442,2258,2793,4037,5635,8226
dw 11542,14430,15257,17800
data ends
table segment
db 21 dup ('year summ ne ?? ')
table ends
stack segment
dw 8 dup (0)
stack ends
code segment
start: mov ax,data
mov ds,ax
mov ax,table
mov es,ax
mov ax,stack
mov ss,ax
mov sp,16
mov bx,0h
mov si,0
mov cx,21
s0: mov ax,si
mov dl,2
div dl
mov di,ax
mov ax,ds:[168+di]
mov es:[bx+10],ax
push cx
mov di,0
mov cx,4
s: mov al,ds:[0+si]
mov es:[bx+0+di],al
mov al,ds:[84+si]
mov es:[bx+5+di],al
inc di
inc si
loop s
mov ax,es:[bx+5]
mov dx,es:[bx+7]
div word ptr es:[bx+10]
mov es:[bx+13],ax
add bx,10h
pop cx
loop s0
mov ax,4c00h
int 21h
code ends
end start
题外话:用汇编写程序真不方便,访问不直观,可能是我写得少。不过通过写这个程序,确实让我学会了结构化的访问数据,操作数据,对循环嵌套,加深了理解,以前简单的嵌套能写,复杂点的要搞半天才能解决,考虑问题没思路,现在感觉抓住结构化这点,至少让我有思路了。