第8章数据处理的两个基本问题-优快云博客

本文链接：https://blog.youkuaiyun.com/yyhshm520/article/details/142637965

8.1 bx、si、di 和 bp

在8086CPU中，只有4个寄存器可用用在“[…]”中来进行内存的单元的寻址：bx、si、di、bp。

错误示范：
mov ax,[cx]
mov ax,[ax]
mov ax,[dx]
mov ax,[ds]

在[…]中，这4个寄存器可以单个出现，或只能以4种组合出现：bx和si、bx和di、bp和si、bp和di。

错误示范：
mov ax,[bx+bp]
mov ax,[si+di]

只要在[....]中使用寄存器bp，而指令中没有显性的给出段地址，段地址就默认在ss中。

8086CPU在[…]中只能出现这4个寄存器，而且只能有这4中组合，让我挺意外的，之前没系统的学习汇编，但懂一些基础的汇编指令，查一些资料难免要看一些简单的汇编指令，当时就有疑问，为什么都喜欢对着ax寄存器反复存取数据，就不能用用其他寄存器，看了这些天汇编终于懂了，寄存器在一些指令中有特殊作用。

8.2 机器指令处理的数据在什么地方

绝大部分机器指令都是进行数据处理的指令，处理大致可分为3类：读取、写入、运算。在机器指令这一层来讲，并不关心数据的值是多少，而关心指令执行前一刻，它将要处理的数据所在的位置。指令执行前，所要处理的数据可以在3个地方：CPU内部、内存、端口（端口将在后面的课程中讨论）

8.3 汇编语言中数据位置的表达

汇编语言用3个概念来表达数据位置：

立即数(idata)： 对于直接包含在机器指令中的数据（执行前在CPU的指令缓冲器中），汇编语言中称为立即数，在汇编指令中直接给出。

寄存器： 指令要处理的数据在寄存器中，在汇编指令中给出相应的寄存器名。

段地址(SA)和偏移地址(EA)： 指令要处理的数据在内存中，在汇编指令中可用[X]的格式给出EA，SA在某个段寄存器中。存放段地址的寄存器可以是默认的，也可以显性给出。

8.4 寻址方式

当数据存放在内存时，我们可以用多种方式来给定这个内存单元的偏移地址，这种定位内存单元的方法一般被称为寻址方式：

直接寻址：[idata]

寄存器间接寻址：[bx]、[si]、[di]、[bp]

寄存器相对寻址：[bx+idata]、[si+idata]、[di+idata]、[bp+idata]

基址变址寻址：[bx+si]、[bx+di]、[bp+si]、[bp+di]

相对基址变址寻址：[bx+si+idata]、[bx+di+idata]、[bp+si+idata]、[bp+di+idata]

8.5 指令要处理的数据有多长

8086CPU的指令，可以处理两种尺寸的数据，byte和word。所以在机器指令中要指明，指令进行的是字操作还是字节操作。

(1)通过寄存器名指明要处理的数据的尺寸。

(2)在没有寄存器名存在的情况下，用操作符 X ptr 指明内存单元的长度，X在汇编指令中可以为word或byte。

在没有寄存器参与的内存单元访问指令中，用word ptr或byte ptr显性地指明所要访问的内存单元长度是很必要的。否则，CPU无法得知所要访问的单元是字单元，还是字节单元。
有些指令默认了访问的是字单元还是字节单元，比如push、pop默认了访问的是字单元。

8.6 寻址方式的综合应用

8086CPU提供的如[bx+si+idata]的寻址方式为结构化数据的处理提供了方便。使得我们可以在编程的时候，从结构化的角度去看待所要处理的数据。一个结构化的数据包含了多个数据项，而数据项的类型又不相同，有的是字型数据，有的是字节型数据，有的是数组(字符串)。一般来说，我们可以用[bx+idata+si]的方式来访问结构体中的数据。用bx定位整个结构体，用idata定位结构体中的某一数据项，用si定位数据项中的每个元素。为此汇编语言提供了更为贴切的书写方式，如：[bx].data、[bx].idata[si]。

学了这一小节，我知道了，以前我写java程序时，数据都是瞎定义，只会根据是字符、布尔值，还是数字、数字长度、数字是不是浮点型，这些表面的东西来定义，或者说复杂的结构化的数据考虑，已经被水平更高的人规划好了，我只需要在别人框架下，写点增删改查。

8.7 div 指令

div 是除法指令，使用div做除法的时候应该注意以下问题：

(1) 除数： 有8位和16位两种，在一个寄存器或内存单元中。

(2) 被除数： 默认放在AX或DX和AX中，如果除数为8位，被除数则位16位，默认在AX中存放； 如果除数为16位，被除数则为32位，在DX和AX中存放，DX存放高16位，AX存放低16位。

(3) 结果： 如果除数为8位，则AL存储除法操作的商，AH存储除法操作的余数；如果除数为16位，则AX存储除法操作的商，DX存储除法操作的余数。

格式：div reg(寄存器)；div 内存单元

32位的被除数分别放在DX和AX两个寄存器时，需要注意一下，十进制先转化为十六进制，高16位放DX，低16位放AX。
在分析后面的实验7时，突然想明白一个问题： 这一小节举得例子，之所以需要你手动将十进制数转换为十六进制，然后再传送给DX、AX寄存器，是因为例子中是对立即数操作。如果你通过dd伪指令在内存中定义一个双字型数字，然后通过mov指令将低两字节传送给AX，高两字节传送给DX，就不需要自己计算了。

8.8 伪指令 dd

db 和 dw 定义字节型数据和字型数据。dd 是用来定义 dword(double word,双字)型数据的。

8.9 dup

dup 是一个操作符，在汇编语言中同db、dw、dd等一样，也是由编译器识别处理的符号。 它是和db、dw、dd等数据定义伪指令配合使用的，用来进行数据的重复。
db 重复次数 dup（重复的字节型数据）
dw 重复次数 dup（重复的字型数据）
dd 重复次数 dup（重复的双字节型数据）

实验7 寻址方式在结构化数据访问中的应用

这是学到现在写得最难的一个汇编程序，构思了一个小时写好了，语法上犯了些错误，如下：

mov指令的两个操作数不能都是内存单元。想想也是执行一条指令，取指令访存一次，再访存两次取两个操作数，效率太低。

div指令的操作数(除数)，不能是立即数(idata)，只能是保存在寄存器或内存单元中。
水平有限，个人代码仅供参考：

assume cs:code,ds:data,es:table,ss:stack

data segment
	db '1975','1976','1977','1978','1979','1980','1981','1982','1983'
	db '1984','1985','1986','1987','1988','1989','1990','1991','1992'
	db '1993','1994','1995'

	dd 16,22,382,1356,2390,8000,16000,24486,50065,97479,140417,197514
	dd 345980,590827,803530,1183000,1843000,2759000,3753000,4649000,5937000

	dw 3,7,9,13,28,38,130,220,476,778,1001,1442,2258,2793,4037,5635,8226
	dw 11542,14430,15257,17800
data ends

table segment
	db 21 dup ('year summ ne ?? ')
table ends

stack segment
	dw 8 dup (0)
stack ends

code segment
	
start:	mov ax,data
	mov ds,ax

	mov ax,table
	mov es,ax

	mov ax,stack
	mov ss,ax
	mov sp,16

	mov bx,0h
	mov si,0

	mov cx,21

s0:	mov ax,si
	mov dl,2
	div dl
	mov di,ax
	mov ax,ds:[168+di]
	mov es:[bx+10],ax

	push cx
	mov di,0
	mov cx,4

s:	mov al,ds:[0+si]
	mov es:[bx+0+di],al
	mov al,ds:[84+si]
	mov es:[bx+5+di],al
	inc di
	inc si
	loop s

	mov ax,es:[bx+5]
	mov dx,es:[bx+7]
	div word ptr es:[bx+10]
	mov es:[bx+13],ax

	add bx,10h
	pop cx
	loop s0

	mov ax,4c00h
	int 21h

code ends

end start

题外话：用汇编写程序真不方便，访问不直观，可能是我写得少。不过通过写这个程序，确实让我学会了结构化的访问数据，操作数据，对循环嵌套，加深了理解，以前简单的嵌套能写，复杂点的要搞半天才能解决，考虑问题没思路，现在感觉抓住结构化这点，至少让我有思路了。