汇编基础

重点：如何利用硬件系统的编程结构和指令集有效灵活的控制系统进行工作。

基础知识

机器语言

机器语言是机器指令的集合。
机器指令展开来讲就是一台机器可以正确执行的命令。

汇编语言的产生

汇编语言的主体是汇编指令
汇编指令和机器指令的差别在于指令的表示方法上。汇编指令的机器指令便于记忆的书写格式。
汇编指令是机器指令的助记符。

机器指令：10001001110111000

操作：寄存器BX的内容送到AX中

汇编指令：MOV AX,BX

寄存器：简单地讲是CPU中可以存储数据的器件，一个CPU中有多个寄存器。

PS:AX，BX是其中两个寄存器的代号。

汇编语言的组成

包括：

汇编指令（机器码的助记符）
伪指令（由编译器执行）
其他符号（由编译器识别）

汇编语言的核心是汇编指令，它决定了汇编语言的特性。

书籍：《编码的奥秘》

存储器

CUP是计算机的核心部分，控制整个计算机的运行并进行运算。

想让一个CPU工作，就必须向它提供指令和数据。

指令和数据在存储器中存放，即内存。
一台PC机中内存的作用仅次于CPU。
离开了内存，性能再好的CPU也无法工作。
磁盘不同于内存，磁盘上的数据或程序如果不读到内存中，就无法被CPU使用。

三者关系

指令和数据

指令和数据时应用上的概念。
在内存或磁盘上，指令和数据没有任何区别，都是二进制信息。
二进制信息：

1000100111011000->89D8H（数据）

1000100111011000->MOV AX,BX（程序）

存储单元

存储器被分为若干个存储单元，每个存储单元从0开始顺序编号。

eg：一个存储器有128个存储单元，编号从0~127。

对于大容量的存储器一般还用以下单位来计量容量（以下用B来代表Byte）：

1KB=1024B

1MB=1024KB

1GB=1024MB

1TB=1024GB

磁盘的容量单位同内存的一样，实际上以上单位是微机中常用的计量单位。

CPU对存储器的读写

CUP必须和外部器件（标准说法：芯片）进行三类信息交互：

存储单元的地址（地址信息）
器件的选择，读或写命令（控制信息）
读或写的数据（数据信息）

在计算机中有专门连接CPU和其他芯片的导线，通常称为总线。

物理上：一根根导线的集合。

逻辑上划分为：

地址总线
数据总线
控制总线

对于8086CPU，下面的机器码能够完成从3号单元读数据：

机器码:1010000000000011000000000
含义：从3号单元读取数据送入寄存器AX
CPU接收这条机器码后将完成上面所述的读写工作。

地址总线

CPU是通过地址总线来指定存储单元的。

地址总线上能传送多少个不同的信息，CPU就可以对多少个存储单元进行寻址。

一个CPU有N根总线，即这个CPU的地址总线的宽度为N。这样的CPU可以寻找到2的N次方个内存单元。

数据总线

CUP与内存或其他器件之间的数据传送是通过数据总线来进行的。

数据总线的宽度决定了CPU和外界的数据传速度。

控制总线

CPU对外部器件的控制是通过控制总线来进行的。控制总线是个总称，是一些不同控制线的集合。

有多少根控制总线，意味着CPU提供了对外部器件的多少种控制。

因此，控制总线的宽度决定了CPU对外部器件的控制能力。

前面所讲的内存读或写命令是由几根控制线综合发出的：

其中有一根名为读信号输出控制线负责由CPU向外传送读信号，CPU向该控制线上输出低电平表示将要读取数据。
有一根名为写信号输出控制线负责由CPU向外传送信号。

小结

汇编指令是机器指令的助记符，同机器指令一一对应。
每一种CPU指令都有自己的汇编指令集。
CPU可以直接使用的信息在存储器中存放。
在存储器中指令和数据没有任何区别，都是二进制信息。
存储单元从零开始顺序编号。
一个存储单元可以存储8个bit，即8位二进制数
1B=8b 1KB=1024B 1MB=1024KB 1GB=1024MB 1TB=1024GB
三种总线的宽度标志了这个CPU的不同方面的性能：
- 地址总线的宽度决定了CPU的寻址能力
- 数据总线的宽度决定了CPU与其他器件进行数据传送时的一次数据传送量
- 控制总线宽度决定了CPU对系统中其他器件的控制能力。

检测点1.1

（1）1个CPU的寻址能力为8KB，那么它的地址总线的宽度为 13位。

（2）1KB的存储器有 1024 个存储单元，存储单元的编号从 0 到 1023 。

（3）1KB的存储器可以存储 8192（2^13）个bit， 1024个Byte。

（4）1GB是 1073741824 （2^30）个Byte、1MB是 1048576（2^20）个Byte、1KB是 1024（2^10）个Byte。

（5）8080、8088、80296、80386的地址总线宽度分别为16根、20根、24根、32根，则它们的寻址能力分别为: 64 （KB）、 1 （MB）、 16 （MB）、 4 （GB）。

（6）8080、8088、8086、80286、80386的数据总线宽度分别为8根、8根、16根、16根、32根。则它们一次可以传送的数据为: 1 （B）、 1 （B）、 2 （B）、 2 （B）、 4 （B）。

（7）从内存中读取1024字节的数据，8086至少要读 512 次，80386至少要读 256 次。

（8）在存储器中，数据和程序以二进制形式存放。

解题过程：

（1）1KB=1024B，8KB=1024B*8=2^N，N=13。

（2）存储器的容量是以字节为最小单位来计算的，1KB=1024B。

（3）8Bit=1Byte，1024Byte=1KB（1KB=1024B=1024B*8Bit）。

（4）1GB=1073741824B（即2^30）1MB=1048576B（即2^20）1KB=1024B（即2^10）。

（5）一个CPU有N根地址线，则可以说这个CPU的地址总线的宽度为N。这样的CPU最多可以寻找2的N次方个内存单元。（一个内存单元=1Byte）。

（6）8根数据总线一次可以传送8位二进制数据（即一个字节）。

（7）8086的数据总线宽度为16根（即一次传送的数据为2B）1024B/2B=512，同理1024B/4B=256。

（8）在存储器中指令和数据没有任何区别，都是二进制信息。
检测点 2.1

(1) 写出每条汇编指令执行后相关寄存器中的值。

内存地址空间

what？

一个CPU的地址宽度为10，那么可以寻址1024个内存单元，这1024个可寻到的内存单元就构成这个CPU的内存地址空间。

主板

在每一台PC机中，都有一个主板，主板上有核心器件和一些主要器件。

这些器件通过总线（地址总线、数据总线、控制总线）相连。

接口卡

计算机系统中，所有可用程序控制其工作的设备，必须受到CPU的控制。

CPU对外部设备不能直接控制，如显示器、音响、打印机等。直接控制这些设备进行工作的是插在扩展插槽上的接口卡。

各类存储器芯片

从读写属性上看分为两类：

随机存储器（RAM）和只读存储器（ROM）

从功能和连接上分类：
- 随机存储器RAM
- 装有BIOS的ROM
- 接口卡上的RAM

装有BIOS的ROM

BIOS：Basic Input/Output System，基本输入输出系统。

BIOS是由主板和各类接口卡（如：显卡、网卡等）产商提供的软件系统，可以通过它利用该硬件设备进行最基本的输入输出。在主板和某些接口卡插有存储相应BIOS的ROM。

CUPP及各内存

上述的那些存储器在物理上是独立的器件。

但是它们在以下两点相同：

都和CPU总线相连。
CPU对它们进行读或写的时候都通过控制线发出内存读写命令。

将各类存储器看作一个逻辑存储器：

所有的物理存储器被看作一个由若干存储单元组成的逻辑存储器。
每个物理存储器在这个逻辑存储器中占有一个地址段，即一段地址空间。
CPU在这段地址空间中读写数据，实际上就是在相应的物理存储器中读写数据。

不同计算机系统的内存地址空间分配情况是不同的。

eg：8086PC机内存地址空间分配的基本情况：

内存地址空间：

最终运行程序的是CPU，我们用汇编编程的时候，必须要从CPU角度考虑问题。（汇编语言核心思维）

对CPU来说，系统中的所有存储器中的存储单元都处于一个统一的逻辑存储器中，它的容量受CPU寻址能力的限制。在这个逻辑存储器即使我们所说的内存地址空间。

寄存器（CPU工作原理）

CPU概述：

一个典型的CPU由运算器、控制器、寄存器等器件组成。这些器件靠内部总线相连。

区别：

内部总线实现CPU内部各个器件之间的联系。

外部总线实现CPU和主板上其他器件的联系。

寄存器概述：

8086CPU有14个寄存器，它们的名称为：

AX,BX,CX,DX,SI,DI,SP,BP,IP,CS.SS,DS,ES,PSW.

通用寄存器

8086CPU所有的寄存器都是16位的，可以存放两个字节。

AX,BX,CX,DX通常用来存放一般性数据被称为通用寄存器。

16位数据在寄存器中的存放情况

8086上一代CPU中的寄存器都是8位的，为保证兼容性，这四个寄存器都可以分为两个独立的8位寄存器使用。

AX可以分为AH和AL；

BX可以分为BH和BL；

CX可以分为CH和CL；

DX可以分为DH和DL。

AX的低8位（0~7位）构成了AL寄存器，高8位（8-15位）构成了AH寄存器。

AH和AL寄存器是可以独立使用的8位寄存器。

一个8位寄存器所能存储的数据的最大值是2^8-1。

字在寄存器中的存储

一个字可以在一个16位寄存器中，这个字的高位字节和低位字节自然就存在这个寄存器的高8位寄存器和低8位寄存器中。

一个字等于两个字节。

关于数制的讨论

几条汇编指令

PS：汇编指令不区分大小写！

检测点2.1

mov ax,62627   AX=F4A3H 

mov ah,31H     AX=31A3H 

mov al,23H     AX=3123H 

add ax,ax      AX=6246H 

mov bx,826CH   BX=826CH 

mov cx,ax      CX=6246H 

mov ax,bx      AX=826CH 

add ax,bx      AX=04D8H 

mov al,bh      AX=0482H 

mov ah,bl      AX=6C82H 

add ah,ah      AX=D882H 

add al,6       AX=D888H 

add al,al      AX=D810H 

mov ax,cx      AX=6246H

(2) 只能使用目前学过的汇编指令，最多使用4条指令，编程计算2的4次方。

mov ax 2 ax=2

add ax ax ax=4

mov ax ax ax=8

add ax ax ax=16

物理地址

CPU访问内存单元时要给出内存单元的地址。所有的内存单元构成的存储空间是一个一维的线性空间。

我们将这个唯一的地址称为物理地址。

16位结构的CPU

概括的讲，16位结构描述了一个CPU具有以下几个方面特征：

运算器一次最多可以处理16位的数据。
寄存器的最大宽度为16位。
寄存器和运算器之间的通路是 16位的

8086CPU给出物理地址的方法

8086有20位地址总线，可传送20位地址，寻址能力为1M。
8086内部为16位结构，它只能传送16位的地址，表现出的寻址能力却只有64K。

8086CPU采用一种在内部用两个16位地址合成的方法来形成一个20位的物理地址。

地址加法器采用物理地址=段地址×16+偏移地址的方法合成20位地址

16进制×16等于左移1位

2进制等于左移4位2

“段地址×16”有一个更为常用的说法就是数据左移4位（二进制）

观察发现：

一个数据的二进制形式左移1位，相当于该数据乘以2；
一个数据的二进制形式左移N位，相当于该数据乘以2的N次方；
地址加法器完成段地址×16的运算：以二进制形式存放的段地址左移4位
一个数据的十六进制形式左移1位，相当于乘以16
一个数据的十进制形式左移1位，相当于乘以10
一个数据的X进制形式左移1位，相当于乘以X。

段地址×16+偏移地址=物理地址的本质含义

两个比喻说明：

基础地址+偏移地址=物理地址

段地址×16+偏移地址=物理地址

段的概念

错误认识：

内存被划分成了一个一个段，每一个段都有一个段地址。

事实上：

内存并没有分段，段的划分来自于CPU，由于8086CPU用“段地址×16”+偏移地址=物理地址的方式给出单元的物理地址，使得什么可以用分段的方式来管理内存。

以后，在编程时可以根据需要，将若干地址连续的内存单元看作一个段，用段地址×16定位段的起始地址（基础地址），用偏移地址定位段中的内存单元。

注意

段地址×16必然是16的倍数，所以一个段的起始地址也一定是16的倍数；
偏移地址为16位，所以一个段的长度最大为64K。

内存单元地址小结

CPU访问内存单元时，必须向内存提供内存单元的物理地址。

8086CPU在内部用段地址和偏移地址移位相加的方法形成最终的物理地址。

CPU可以用不同的段地址和偏移地址形成同一个物理地址。

思考：

如果给定一个段地址，仅通过变化偏移地址来进行寻址，最多可以定位多少内存单元？

结论：偏移地址16位，变化范围为0~FFFFH，仅用偏移地址来寻址最多可寻64K个内存单元。2^16=64KB

eg：给定段地址10000H,用偏移地址寻址，CPU的寻址范围为：10000H~1FFFFH

强调

在8086PC机中，存储单元的地址用两个元素来描述。即段地址和偏移地址。

“数据在21F60H内存单元中”。对于8086PC机的两种描述：

1.数据存在内存2000:1F60单元中；

2.数据存在内存的2000段中的1F60H单元中。

可根据需要，将地址连续、起始地址为16倍数的一组内存单元定义为一个段。

检测点2.2

（1）给定地址为0001H，仅通过变化偏移地址寻址，CPU的寻址范围为_______到___。

（2）有一段数据存放在内存20000H单元中，现给定段地址为SA，若想用偏移地址寻到此单元，则SA应满足的条件是：最小为___,最大为______.

答案：

0010H 到 1000FH

解题过程：

物理地址＝SA*16+EA

EA的变化范围为0h~ffffh

物理地址范围为(SA16+0h)~(SA16+ffffh)

现在SA=0001h,那么寻址范围为

(0001h16+0h)~(0001h16+ffffh)

=0010h~1000fh
最小为 1001H ，最大为 2000H 。

解题过程：

物理地址＝SA*16+EA

20000h＝SA*16+EA

SA=(20000h-EA)/16=2000h-EA/16

EA取最大值时,SA=2000h-ffffh/16=1001h,SA为最小值

EA取最小值时,SA=2000h-0h/16=2000h,SA为最大值

段寄存器

段寄存器就是提供段地址的。

8086CPU有4个段寄存器：

CS、DS、SS、ES

当8086CPU要访问内存时，由这4个段寄存器提供内存单元的段地址。

CS和IP

CS和IP是8086CPU中关键的寄存器，它们指示了CPU当前要读取指令的地址。

CS为代码段寄存器。

IP为指令指针寄存器。

工作简述：

从CS：IP指向内存单元读取指令，读取的指令进入指令缓冲区
IP=IP+所读取指令的长度，从而指向下一条指令
执行指令，跳转到步骤（1），重复这个过程。
在8086CPU加电启动或复位后（即CPU刚开始工作时）CS和IP被设置为CS=FFFFH,IP=0000H
即在8086PC机刚启动时，CPU从内存FFFF0H单元中读取指令执行。
FFFF0H单元中的指令是80866PC机开机后执行的第一条指令。
在任何时候，CPU将CS、IP中的内容当指令的段地址和偏移地址，用它们合成指令的物理地址，到内存中读取指令码，执行。
如果说，内存中的一段信息曾被CPU执行过的话，那么，它所在的内存单元必然被CS:IP指向过。

修改CS、IP的指令

MOV 指令不能用于设置CS、IP的值，8086CPU没有这样的功能。

另外功能：转移指令：jmp

同时修改CS、IP的内容：

1
2
3

jmp 段地址 ： 偏移地址
	jmp 2AE3:3
	jmp 3:0416

注意：第二条语句最终指向：B46H

（用上个内容的计算方法）

功能：用指令中给出的段地址修改CS,偏移地址修改IP

仅修改IP内容

jmp 某一合法寄存器
1
2
jmp ax （类似 mov IP,ax）
jmp bx
功能：用寄存器中的值修改IP

分析结果：

mov ax,6622
jmp 1000:3
mov ax,0000
mov bx,ax
jmp bx
mov ax,0123
mov ax,0000
……死循环了

偏移地址不能超过16位，即一个段的索引长不能超过2^16次方，即64KB，

小结

段地址在8086CPU的寄存器中存放，当8086CPU要访问内存时，由段寄存器提供内存单元的段地址。
CS存放指令的段地址，IP存放指令的偏移地址。
8086机中，任意时刻，CPPU将CS：IP指向的内容当作指令执行。
8086CPU提供转移指令修改CS、IP的内容。

工作过程：

1.从CS:IP指向内存单元读取指令，读取的指令进入指令缓冲器

2.IP指向下一条指令。

3.执行指令。（转到步骤1，重复这个过程）

检测点2.3

下面的3条指令执行后，cpu几次修改IP？都是在什么时候？最后IP中的值是多少？

mov ax,bx

sub ax,ax

jmp ax

答：一共修改四次

第一次：读取mov ax,bx之后

第二次：读取sub ax,ax之后

第三次：读取jmp ax之后

第四次：执行jmp ax修改IP

最后IP的值为0000H，因为最后ax中的值为0000H，所以IP中的值也为0000H