一、程序的装入和链接
1、多道程序环境下,程序运行必须为之先建立进程。
创建进程的第一件事:将程序和数据装入内存。
2、程序进内存的一般过程:
①编译compiler:编译程序:将用户源代码编译成若干个目标模块。
②链接link:链接程序:将形成的一组目标模块,及它们需要的库函数链接在一起,形成一个完整的装入模块。
③装入load:由装入程序将装入模块装入内存,构造PCB,形成进程,开始运行(使用物理地址)。
3、地址的概念
1)逻辑地址(相对地址,虚地址)
用户的程序经过汇编或编译后形成目标代码,目标代码中的指令地址是相对地址。
一般首地址为0,其余指令中的地址都相对于首地址来编址。
不能用逻辑地址在内存中读取信息。
2)物理地址(绝对地址,实地址)
内存中存储单元的地址。
物理地址可直接寻址被执行。
3)地址映射:
将用户程序中的逻辑地址转换为运行时由机器直接寻址的内存物理地址的过程。
即:用户的第10字节处的指令在内存的第多少地址上。
4、程序装入中的地址处理
逻辑地址 ======== 物理地址:
①绝对装入方式
逻辑地址→重定位→物理地址
②静态可重定位装入方式
③动态运行时(重定位)装入方式
1)绝对装入方式
编译程序生成的“目标代码”就是”装入模块” ,逻辑地址直接从某个地址R处增长,装入模块直接装入内存地址R处。
物理地址一般由编译或汇编程序给出或由程序员赋予(要求程序员熟悉内存使用情况)
优点:装入过程简单。不需任何地址变换,程序中的逻辑地址与实际内存物理地址完全相同。
缺点:过于依赖硬件结构, 只适用早期针对硬件直接编程、单道环境下。
2)静态可重定位装入方式
地址映射在程序执行之前进行,重定位后物理地址不再改变。
可由专门设计的重定位装配程序完成(软):装入时根据所定位的内存地址去修改每个逻辑地址,添加相应偏移量,重定位为物理地址。
优点:不需硬件支持,可以装入有限的多道程序
缺点:软件装入一次完成,一个程序通常需要占用连续的内存空间,程序装入内存后不能移动。也不易实现共享。
3)动态运行时(重定位)装入方式
实际运行中往往会需要程序在内存中的各位置移动,即经常需要重定位到不同的物理地址上。这种运行时移动程序要求地址变换要快速,实现时一般依靠硬件地址变换机构——一个重定位寄存器。
程序装入内存时,可多次重定位到不同位置。且可以不立即把装入模块中的相对地址转换为绝对地址,而是把这种地址转换推迟到程序真正要执行时才进行。
更适用于部分装入。
5、不同的程序链接方式
装入是使用内存的开始,但链接的不同会使内存的使用有差别
根据链接时间的不同,分成三种:
①静态链接:装入运行前将多个目标模块及所需库函数链接成一个整体,以后不再拆开。
②装入时动态链接:装入内存时,边装入边链接的链接方式。
③运行时动态链接:对某些目标模块的链接,在执行中需要该目标模块时,才对它进行链接。
1)静态链接:
装入运行前,生成可执行文件时进行的。
将多个目标模块及所需库函数链接成一个整体,以后不再拆开。
2)装入时动态链接
由一个目标模块开始装入,若又涉及外部模块调用事件,装入程序再找出相应的外部目标模块,并将它装入内存,还要修改目标模块中的相对地址。
比静态链接好在哪里?
① 静态链接好的程序,修改部分模块后,需重新链接成可装入程序。动态方式则便于修改和更新。
②便于实现共享。静态的N个程序都需要一个模块时,需要进行N次拷贝。
3)运行时动态链接:
装入时动态链接的问题:许多情况下,事先不知道某应用程序本次运行需要哪些模块,只能全部装入,装入时全部链接在一起,效率低。
办法:有的模块不经常使用就暂时不装入,运行时用到了再装入。(如程序总不出错,就不会用到错误处理模块。)即运行时动态链接:运行时,将对某些模块的链接推迟到执行时才链接装入。
优点:程序运行装入的内容少了,加快了装入过程,而且节省大量的内存空间。
二、连续分配存储管理方式
连续分配方式为一个用户程序分配一个连续的内存空间
20世纪六、七十年代的OS中,分类:
①单一连续分配
②固定分区分配
③动态分区分配
④动态重定位分区分配
⑤其他
1、单一连续分配
内存分为系统区和用户区两部分:
系统区:仅提供给OS使用,通常放在内存低址部分
用户区:除系统区以外的全部内存空间,提供给用户使用。
最简单的一种存储管理方式,只能用于单用户、单任务的操作系统中。
优点:易于管理。
缺点:对要求内存空间少的程序,造成内存浪费;程序全部装入,很少使用的程序部分也占用内存。
2、固定分区分配
把内存分为一些大小相等或不等的分区(partition),每个应用进程占用一个分区。操作系统占用其中一个分区。
提高:支持多个程序并发执行,适用于多道程序系统和分时系统。最早的多道程序存储管理方式。
划分为几个分区,便只允许几道作业并发
1)如何划分分区大小:
分区大小相等:只适合于多个相同程序的并发执行(处理多个类型相同的对象)。缺乏灵活性。
分区大小不等:多个小分区、适量的中等分区、少量的大分区。根据程序的大小,分配当前空闲的、适当大小的分区。
2)需要的数据结构
建立一记录相关信息的分区表(或分区链表),表项有:
| 起始位置 | 大小 | 状态 |
分区表中,表项值随着内存的分配和释放而动态改变
3)程序分配内存的过程:
也可将分区表分为两个表格:空闲分区表/占用分区表。从而减小每个表格长度。
检索算法:空闲分区表可能按不同分配算法采用不同方式对表项排序(将分区按大小排队或按分区地址高低排序)。
过程:检索空闲分区表;找出一个满足要求且尚未分配的分区,分配给请求程序;若未找到大小足够的分区,则拒绝为该用户程序分配内存。
3、动态分区分配
分区的大小不固定:在装入程序时根据进程实际需要,动态分配内存空间,即——需要多少划分多少。
空闲分区表项:从1项到n项:
内存会从初始的一个大分区不断被划分、回收从而形成内存中的多个分区。
动态分区分配
优点:并发进程数没有固定数的限制,不产生内碎片。
缺点:有外碎片(分区间无法利用的空间)
具体实现:
1)分区分配中的数据结构
①空闲分区表:
记录每个空闲分区的情况。
每个空闲分区对应一个表目,包括分区序号、分区始址及分区的大小等数据项。
②空闲分区链:
每个分区的起始部分,设置用于控制分区分配的信息,及用于链接各分区的前向指针;
分区尾部则设置一后向指针,在分区末尾重复设置状态位和分区大小表目方便检索。
2)分区分配算法
动态分区方式,分区多、大小差异各不相同,此时把一个新作业装入内存,更需选择一个合适的分配算法,从空闲分区表/链中选出一合适分区
①首次适应算法FF
Ⅰ)空闲分区排序:以地址递增的次序链接。
Ⅱ)检索:分配内存时,从链首开始顺序查找直至找到一个大小能满足要求的空闲分区;
Ⅲ)分配:从该分区中划出一块作业要求大小的内存空间分配给请求者,余下的空闲分区大小改变仍留在空闲链中。
若从头到尾检索不到满足要求的分区则分配失败
优点:优先利用内存低址部分,保留了高地址部分的大空闲区;
缺点:但低址部分不断划分,会产生较多小碎片;而且每次查找从低址部分开始,会逐渐增加查找开销。
②循环首次适应算法
Ⅰ)空闲分区排序:按地址
Ⅱ)检索:从上次找到的空闲分区的下一个空闲分区开始查找,直到找到一个能满足要求的空闲分区。为实现算法,需要:
❶设置一个起始查寻指针
❷采用循环查找方式
Ⅲ)分配:分出需要的大小
优点:空闲分区分布均匀,减少查找开销
缺点:缺乏大的空闲分区
③最佳适应算法
总是把能满足要求、又是最小的空闲分区分配给作业,避免“大材小用”。
Ⅰ)空闲分区排序:所有空闲分区按容量从小到大排序成空闲分区表或链。
Ⅱ)检索:从表或链的头开始,找到的第一个满足的就分配
Ⅲ)分配:分出需要的大小
缺点:每次找到最合适大小的分区割下的空闲区也总是最小,会产生许多难以利用的小空闲区(外碎片)
④最差适应算法
最差适应算法/最坏匹配法:基本不留下小空闲分区,但会出现缺乏较大的空闲分区的情况。
⑤快速适应算法
根据进程常用空间大小进行划分,相同大小的串成一个链,需管理多个各种不同大小的分区的链表。进程需要时,从最接近大小需求的链中摘一个分区。
能快速找到合适分区,但链表信息会很多;实际上是空间换时间。
3)分区分配操作
分配内存
找到满足需要的合适分区,划出进程需要的空间
if s<=size,将整个分区分配给请求者
if s> size,按请求的大小划出一块内存空间分配出去,余下部分留在空闲链中,将分配区首址返回给调用者。
回收内存:
进程运行完毕释放内存时,系统根据回收区首址a,在空闲分区链(表)中找到相应插入点,根据情况修改空闲分区信息,可能会进行空闲分区的合并。
回收分区:
①回收区(首址a)与一个分区f1末尾(首址b+大小)邻接:将回收区与f1合并,修改f1的表项的分区大小
②回收区(首址a+大小)与一个分区f2的首址b邻接:将回收区与f2合并,修改f2的表项的首址、分区大小
③ 、①②两种情况都有,则将回收区与前后两个分区F1、F2邻接:将三个分区合并,使用F1的表项和F1的首址,取消F2的表项,大小为三者之和
④ 回收区没有邻接的分区:为回收区单独建立新表项,填写回收区的首址与大小,根据其首址插到空闲链中的适当位置
4、动态重定位分区分配——有紧凑功能的动态分区分配
①地址变换过程是在程序执行过程期间(相对地址与重定位寄存器中的地址相加),随着对每条指令的访问自动进行,称为动态重定位。
②动态重定位分区分配算法与动态分区分配算法基本相同,差别在于增加了紧凑的功能。
5、伙伴系统
分区大小有规定,且分区动态变化
①无论已分配还是空闲分区,大小都为2的k此幂。若整个可分配空间大小为2m,则1≤k≤m.
②随着系统运行,内存被不断划分,形成若干不连续的空闲分区。对每一类具有相同大小的空闲分区设置一双向链表,即会有k个链表,链表中的分区大小都是2m。
③进程申请n个大小的空间时,计算n= 2i。则找i对应的链表。若i大小的链表没有,则找i+1的链表。找到的分区对半划分后,一半用于分配,一半链接到较小一级的链表里去。
④一次分配和回收都可能对应多次的划分和合并。
6、内存空间管理之对换
1)当内存空间还是满足不了需求时,引入“对换”思想:把内存中暂时不能运行、或暂时不用的程序和数据调到外存上,以腾出足够的内存;把已具备运行条件的进程和进程所需要的程序和数据,调入内存。
2)按对换单位分类:
整体对换(或进程对换):以整个进程为单位(连续分配)
页面对换或分段对换:以页或段为单位(离散分配)
3)对换空间的管理:
在系统中设置相应的数据结构以记录对换区的使用情况
对换空间的分配与回收是连续方式,与动态分区方式时的内存分配与回收雷同。
三、基本分页存储管理方式
1)页面的概念
内存划分成多个小单元,每个单元K大小,称(物理)块。作业也按K单位大小划分成片,称为页面。
① 物理划分块的大小 = 逻辑划分的页的大小
②页面大小要适中。太大的话,(最后一页)内碎片增大,类似连续分配的问题。太小的话,页面碎片总空间虽然小,提高了利用率,但每个进程的页面数量较多,页表过长,反而又增加了空间使用。
2)页表的概念
①为了找到被离散分配到内存中的作业,记录每个作业各页映射到哪个物理块,形成的页面映射表,简称页表。
②每个作业有自己的页表
③页表的作用:页号到物理块号的地址映射
④要找到作业A
→关键是找到页表(PCB)
→根据页表找物理块
3)地址的处理
地址映射(地址计算)的过程?
若要执行某作业的一条指令,其相对地址是24B (设10B一页,页表如上表),其物理地址到底是多少呢?
①分析其所在的页和偏移得:2号页(页号从0开始) ,偏移4B处是该条指令
②查页表找页面对应的块(2号页保存在6号物理块)
③找物理块6,向下偏移4B,找到要执行的指令。取出执行即可。
计算上就是求商(页号)及取余(偏移量)的过程。
计算口诀:
m位 | n位 |
---|
页面大小决定偏移量(页内地址)的位数 n;
作业大小页面数量
→页表长度 a
→页号的位数 m(或总位数-页内位数)
内存容量决定块数,块数决定编址位数,即页表项位数 b。
例:用户地址1000 0000 0010如何找到页号?
①若页面大小为1K,页内地址10位
②一个4K大小的作业,逻辑地址共12位
32位寻址的逻辑地址结构
4)地址变换机构
地址变换过程:
分页系统中,进程创建,放入内存,构建页表,在PCB中记录页表存放在内存的首地址及页表长度。
①运行某进程A时,将A进程PCB中的页表信息写入PTR中;
②每执行一条指令时,根据分页计算原理,得到指令页号X和内部偏移量Y;
③CPU高速访问PTR找到页表在哪里;
注:为防止错误检索,增加预先的判断:
❶计算得到的页号是否大于页表长度(即页表项数)
❷ 一个5页的进程,页面编号0-4,若地址计算出的页号不在该范围,一定产生了越界错误。
④查页表数据,得到X实际对应存放的物理块,完成地址映射计算,最终在内存找到该指令。
5)快表
问题:基本分页机制下,一次指令需两次内存访问,处理机速度降低1/2,分页空间效率的提高以如此的速度为代价,得不偿失。
改进:减少第1步访问内存的时间。增设一个具有“并行查询”能力的高速缓冲寄存器,称为“快表”,也称“联想寄存器”
快表放什么?正在执行进程的页表的数据项。