汇编
“被调用者保存”和“调用者保存”寄存器
编译器的设计中有个概念叫做“被调用者保存”和“调用者保存”,可以近似的按子函数保存和父函数保存对应来理解,这一概念的出现完全是由于寄存器资源个数有限造成的。当父函数在调用子函数时,由于子函数可能访问到父函数用于保存数值的寄存器,为了互不干扰和造成覆盖,编译器就制定了相应的规则,%eax、%edx 和%ecx 被划分为“调用者保存”寄存器,顾名思义,这些寄存器上面存储的值,需要调用者(父函数)自己想办法先备份好,否则过会子函数直接使用这些寄存器时将无情的覆盖。如何备份?当然是事先压入栈中,等子函数调用完,再通过出栈恢复这些寄存器原本在父函数运行时的旧值;另外三个寄存器%ebx、%esi、%edi 被划分为“被调用者保存”寄存器,同样的,这些寄存器上有值,在使用前需要被调用者(子函数)自己想办法帮调用者(父函数)进行备份,具体方法就是子函数在覆盖他们之前,先进行入栈备份,等子函数返回时,再出栈还原父函数运行时这些寄存器上的旧值。
七种寻址方式
1 立即寻址方式
操作数作为指令的一部分而直接写在指令中,这种操作数称为立即数,这种寻址方式也就称为立即数寻址方式。
立即数可以是 8 位、16 位或 32 位,该数值紧跟在操作码之后。如果立即数为 16 位或 32 位,那么,它将按“高高低低”的原则进行存储。例如:
MOV AH, 80H ADD AX, 1234H MOV ECX, 123456H
MOV B1, 12H MOV W1, 3456H ADD D1, 32123456H
其中:B1、W1 和 D1 分别是字节、字和双字单元。
以上指令中的第二操作数都是立即数,在汇编语言中,规定:立即数不能作为指令中的第二操作数。该规定与高级语言中“赋值语句的左边不能是常量”的规定相一致。
立即数寻址方式通常用于对通用寄存器或内存单元赋初值。图是指令“MOV AX, 4576H”存储形式和执行示意图。
2 寄存器寻址方式
指令所要的操作数已存储在某寄存器中,或把目标操作数存入寄存器。把在指令中指出所使用寄存器(即:寄存器的助忆符)的寻址方式称为寄存器寻址方式。
指令中可以引用的寄存器及其符号名称如下:
8 位寄存器有:AH、AL、BH、BL、CH、CL、DH 和 DL 等;
16 位寄存器有:AX、BX、CX、DX、SI、DI、SP、BP 和段寄存器等;
32 位寄存器有:EAX、EBX、ECX、EDX、ESI、EDI、ESP 和 EBP 等。
寄存器寻址方式是一种简单快捷的寻址方式,源和目的操作数都可以是寄存器。
1、源操作数是寄存器寻址方式
如:ADD VARD, EAX ADD VARW, AX MOV VARB, BH 等。
其中:VARD、VARW 和 VARB 是双字,字和字节类型的内存变量。在第 4 章将会学到如何定义它们。
2、目的操作数是寄存器寻址方式
如:ADD BH, 78h ADD AX, 1234h MOV EBX, 12345678H 等。
3、源和目的操作数都是寄存器寻址方式
如:MOV EAX, EBX MOV AX, BX MOV DH, BL 等。
由于指令所需的操作数已存储在寄存器中,或操作的结果存入寄存器,这样,在指令执行过程中,会减少读/写存储器单元的次数,所以,使用寄存器寻址方式的指令具有较快的执行速度。通常情况下,我们提倡在编写汇编语言程序时,应尽可能地使用寄存器寻址方式,但也不要把它绝对化。
3 七种寻址方式(直接寻址方式)
指令所要的操作数存放在内存中,在指令中直接给出该操作数的有效地址,这种寻址方式为直接寻址方式。
在通常情况下,操作数存放在数据段中,所以,其物理地址将由数据段寄存器 DS 和指令中给出的有效地址直接形成,但如果使用段超越前缀,那么,操作数可存放在其它段。
例:假设有指令:MOV BX, [1234H],在执行时,(DS)=2000H,内存单元 21234H 的值为 5213H。问该指令执行后,BX 的值是什么?
解:根据直接寻址方式的寻址规则,把该指令的具体执行过程用下图来表示。
从图中,可看出执行该指令要分三部分:
由于 1234H 是一个直接地址,它紧跟在指令的操作码之后,随取指令而被读出;
访问数据段的段寄存器是 DS,所以,用 DS 的值和偏移量 1234H 相加,得存储单元的物理地址:21234H;
取单元 21234H 的值 5213H,并按“高高低低”的原则存入寄存器 BX 中。
所以,在执行该指令后,BX 的值就为 5213H。
由于数据段的段寄存器默认为 DS,如果要指定访问其它段内的数据,可在指令中用段前缀的方式显式地书写出来。
下面指令的目标操作数就是带有段前缀的直接寻址方式。
MOV ES:[1000H], AX
直接寻址方式常用于处理内存单元的数据,其操作数是内存变量的值,该寻址方式可在 64K 字节的段内进行寻址。
注意:立即寻址方式和直接寻址方式的书写格式的不同,直接寻址的地址要写在括号“[”,“]”内。在程序中,直接地址通常用内存变量名来表示,如:MOV BX, VARW,其中,VARW 是内存字变量。
试比较下列指令中源操作数的寻址方式(VARW 是内存字变量):
MOV AX, 1234H MOV AX, [1234H] ;前者是立即寻址,后者是直接寻址
MOV AX, VARW MOV AX, [VARW] ;两者是等效的,均为直接寻址
4 七种寻址方式(寄存器间接寻址方式)
操作数在存储器中,操作数的有效地址用 SI、DI、BX 和 BP 等四个寄存器之一来指定,称这种寻址方式为寄存器间接寻址方式。该寻址方式物理地址的计算方法如下:
寄存器间接寻址方式读取存储单元的原理如图所示。
在不使用段超越前缀的情况下,有下列规定:
若有效地址用 SI、DI 和 BX 等之一来指定,则其缺省的段寄存器为 DS;
若有效地址用 BP 来指定,则其缺省的段寄存器为 SS(即:堆栈段)。
例:假设有指令:MOV BX,[DI],在执行时,(DS)=1000H,(DI)=2345H,存储单元 12345H 的内容是 4354H。问执行指令后,BX 的值是什么?
解:根据寄存器间接寻址方式的规则,在执行本例指令时,寄存器 DI 的值不是操作数,而是操作数的地址。该操作数的物理地址应由 DS 和 DI 的值形成,即:
PA=(DS)16+DI=1000H16+2345H=12345H。
所以,该指令的执行效果是:把从物理地址为 12345H 开始的一个字的值传送给 BX。
其执行过程如图所示。
5 七种寻址方式(寄存器相对寻址方式)
操作数在存储器中,其有效地址是一个基址寄存器(BX、BP)或变址寄存器(SI、D
I)的内容和指令中的 8 位/16 位偏移量之和。其有效地址的计算公式如公式所示。
在不使用段超越前缀的情况下,有下列规定:
若有效地址用SI、DI和BX等之一来指定,则其缺省的段寄存器为DS;
若有效地址用BP来指定,则其缺省的段寄存器为SS。
指令中给出的 8 位/16 位偏移量用补码表示。在计算有效地址时,如果偏移量是 8 位,则进行符号扩展成 16 位。当所得的有效地址超过 0FFFFH,则取其 64K 的模。
例:假设指令:MOV BX, [SI+100H],在执行它时,(DS)=1000H,(SI)=2345H,内存单元 12445H 的内容为 2715H,问该指令执行后,BX 的值是什么?
解:根据寄存器相对寻址方式的规则,在执行本例指令时,源操作数的有效地址 EA 为:
EA=(SI)+100H=2345H+100H=2445H
该操作数的物理地址应由 DS 和 EA 的值形成,即:
PA=(DS)16+EA=1000H16+2445H=12445H。
所以,该指令的执行效果是:把从物理地址为 12445H 开始的一个字的值传送给 BX。
其执行过程如图所示。
6 七种寻址方式(基址加变址寻址方式)
操作数在存储器中,其有效地址是一个基址寄存器(BX、BP)和一个变址寄存器(SI、DI)的内容之和。其有效地址的计算公式如公式所示。
在不使用段超越前缀的情况下,规定:如果有效地址中含有 BP,则缺省的段寄存器为 SS;否则,缺省的段寄存器为 DS。
例:假设指令:MOV BX, [BX+SI],在执行时,(DS)=1000H,(BX)=2100H,(SI)=0011H,内存单元 12111H 的内容为 1234H。问该指令执行后,BX 的值是什么?
解:根据基址加变址寻址方式的规则,在执行本例指令时,源操作数的有效地址 EA 为:
EA=(BX)+(SI)=2100H+0011H=2111H
该操作数的物理地址应由 DS 和 EA 的值形成,即:
PA=(DS)16+EA=1000H16+2111H=12111H
所以,该指令的执行效果是:把从物理地址为 12111H 开始的一个字的值传送给 BX。
其执行过程如图所示。
7 七种寻址方式(相对基址加变址寻址方式)
操作数在存储器中,其有效地址是一个基址寄存器(BX、BP)的值、一个变址寄存器(SI、DI)的值和指令中的 8 位/16 位偏移量之和。其有效地址的计算公式如公式所示。
在不使用段超越前缀的情况下,规定:如果有效地址中含有 BP,则其缺省的段寄存器为 SS;否则,其缺省的段寄存器为 DS。
指令中给出的 8 位/16 位偏移量用补码表示。在计算有效地址时,如果偏移量是 8 位,则进行符号扩展成 16 位。当所得的有效地址超过 0FFFFH,则取其 64K 的模。
例:假设指令:MOV AX, [BX+SI+200H],在执行时,(DS)=1000H,(BX)=2100H,(SI)=0010H,内存单元 12310H 的内容为 1234H。问该指令执行后,AX 的值是什么?
解:根据相对基址加变址寻址方式的规则,在执行本例指令时,源操作数的有效地址 EA 为:
EA=(BX)+(SI)+200H=2100H+0010H+200H=2310H
该操作数的物理地址应由 DS 和 EA 的值形成,即:
PA=(DS)16+EA=1000H16+2310H=12310H
所以,该指令的执行效果是:把从物理地址为 12310H 开始的一个字的值传送给 AX。其执行过程如图所示。
从相对基址加变址这种寻址方式来看,由于它的可变因素较多,看起来就显得复杂些,但正因为其可变因素多,它的灵活性也就很高。比如:
用 D1[i]来访问一维数组 D1 的第 i 个元素,它的寻址有一个自由度,用 D2[i][j]来访问二维数组 D2 的第 i 行、第 j 列的元素,其寻址有二个自由度。多一个可变的量,其寻址方式的灵活度也就相应提高了。
相对基址加变址寻址方式有多种等价的书写方式,下面的书写格式都是正确的,并且其寻址含义也是一致的。
MOV AX, [BX+SI+1000H] MOV AX, 1000H[BX+SI]
MOV AX, 1000H[BX][si] MOV AX, 1000H[SI][bx]
但书写格式 BX [1000+SI]和 SI[1000H+BX]等是错误的,即所用寄存器不能在“[“,”]”之外,该限制对寄存器相对寻址方式的书写也同样起作用。
相对基址加变址寻址方式是以上 7 种寻址方式中最复杂的一种寻址方式,它可变形为其它类型的存储器寻址方式。下表列举出该寻址方式与其它寻址方式之间的变形关系。