线性地址转物理地址

二、线性地址转物理地址

前面说了Linux中逻辑地址等于线性地址,那么线性地址怎么对应到物理地址呢?这个大家都知道,那就是通过分页机制,具体的说,就是通过页表查找来对应物理地址。

准确的说分页是CPU提供的一种机制,Linux只是根据这种机制的规则,利用它实现了内存管理。

在保护模式下,控制寄存器CR0的最高位PG位控制着分页管理机制是否生效,如果PG=1,分页机制生效,需通过页表查找才能把线性地址转换物理地址。如果PG=0,则分页机制无效,线性地址就直接做为物理地址。

分页的基本原理是把内存划分成大小固定的若干单元,每个单元称为一页(page),每页包含4k字节的地址空间(为简化分析,我们不考虑扩展分页的情况)。这样每一页的起始地址都是4k字节对齐的。为了能转换成物理地址,我们需要给CPU提供当前任务的线性地址转物理地址的查找表,即页表(page table)。注意,为了实现每个任务的平坦的虚拟内存,每个任务都有自己的页目录表和页表

为了节约页表占用的内存空间,x86将线性地址通过页目录表和页表两级查找转换成物理地址。

32位的线性地址被分成3个部分:

最高10位 Directory 页目录表偏移量,中间10位 Table是页表偏移量,最低12位Offset是物理页内的字节偏移量。

页目录表的大小为4k(刚好是一个页的大小),包含1024项,每个项4字节(32位),项目里存储的内容就是页表的物理地址。如果页目录表中的页表尚未分配,则物理地址填0。

页表的大小也是4k,同样包含1024项,每个项4字节,内容为最终物理页的物理内存起始地址。

每个活动的任务,必须要先分配给它一个页目录表,并把页目录表的物理地址存入cr3寄存器。页表可以提前分配好,也可以在用到的时候再分配

还是以 mov    0x80495b0, %eax 中的地址为例分析一下线性地址转物理地址的过程。

前面说到Linux中逻辑地址等于线性地址,那么我们要转换的线性地址就是0x80495b0。转换的过程是由CPU自动完成的,Linux所要做的就是准备好转换所需的页目录表和页表(假设已经准备好,给页目录表和页表分配物理内存的过程很复杂,后面再分析)。

内核先将当前任务的页目录表的物理地址填入cr3寄存器。

线性地址 0x80495b0 转换成二进制后是 0000 1000 0000 0100 1001 0101 1011 0000,最高10位0000 1000 00的十进制是32,CPU查看页目录表第32项,里面存放的是页表的物理地址。线性地址中间10位00 0100 1001 的十进制是73,页表的第73项存储的是最终物理页的物理起始地址。物理页基地址加上线性地址中最低12位的偏移量,CPU就找到了线性地址最终对应的物理内存单元。

我们知道Linux中用户进程线性地址能寻址的范围是0 - 3G,那么是不是需要提前先把这3G虚拟内存的页表都建立好呢?一般情况下,物理内存是远远小于3G的,加上同时有很多进程都在运行,根本无法给每个进程提前建立3G的线性地址页表。Linux利用CPU的一个机制解决了这个问题。进程创建后我们可以给页目录表的表项值都填0,CPU在查找页表时,如果表项的内容为0,则会引发一个缺页异常,进程暂停执行,Linux内核这时候可以通过一系列复杂的算法给分配一个物理页,并把物理页的地址填入表项中,进程再恢复执行。当然进程在这个过程中是被蒙蔽的,它自己的感觉还是正常访问到了物理内存。

### 逻辑地址、线性地址、虚拟地址和物理地址的区别 #### 逻辑地址 逻辑地址也被称为有效地址或段内偏移地址,在任何CPU模式下都存在。它由程序产生的相对某个段寄存器的偏移量构成。例如,在实模式下的汇编指令 `mov ax, [0x7c00]` 中,`0x7c00` 就是一个逻辑地址[^3]。 #### 线性地址 当启用了分页机制时,线性地址作为从逻辑地址转换物理地址过程中的过渡形式出现;而在未启用分页的情况下,则直接充当物理地址的角色。具体来说,线性地址是由逻辑地址(即段内的偏移地址)加上相应的段基址计算得出的结果。对于支持此特性的处理器架构而言,比如 Intel 80386 处理器家族成员所定义的最大可寻址范围可达4GB (2^32)[^2]。 #### 虚拟地址 在现代操作系统中广泛采用的一种抽象概念——虚拟地址实际上指的是应用程序视角下的线性地址。这意味着每个独立执行单元(如进程)都被赋予了一套统一而连续的地址区间供其自由支配,即使这些区域可能映射到了不相邻甚至散布于整个系统的不同部分的真实存储资源上。因此,借助这种间接层次的设计理念,软件开发者可以更加方便地编写代码而不必关心底层硬件细节[^4]。 #### 物理地址 最终被用来真正定位RAM芯片内部特定字节位置的信息便是所谓的物理地址。它是经过一系列复杂的变换流程之后得到的实际可用数值,用于指示具体的内存单元所在之处。只有在这个阶段,计算机才能确切知道要读取或写入的数据究竟位于哪里[^1]。 ```cpp // 示例:展示如何获取当前平台上的页面大小 #include <unistd.h> longpagesize=getpagesize(); printf("Page size:%ld\n",pagesize); ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值