Linux内存分段分页管理机制

最新推荐文章于 2025-04-25 12:07:18 发布

贾167

最新推荐文章于 2025-04-25 12:07:18 发布

阅读量365

点赞数

文章标签： linux 运维服务器

本文链接：https://blog.youkuaiyun.com/weixin_60713230/article/details/133763140

版权

本文详细阐述了32位x86架构计算机中，从实模式到保护模式的内存管理变化，包括分段机制、段寄存器的作用，以及GDT和全局描述符表在内存隔离和保护中的作用。同时介绍了分页机制如何提高内存利用率和多任务隔离。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

以32位x86架构计算机，linux内核说明

操作系统进入保护模式前的内存布局

保护模式下的分段机制：

实模式与保护模式：

实模式出现于早期8088CPU时期。当时由于CPU的性能有限，一共只有20位地址线（所以地址空间只有1MB），以及8个16位的通用寄存器，以及4个16位的段寄存器。所以为了能够通过这些16位的寄存器去构成20位的主存地址，必须采取一种特殊的方式。当某个指令想要访问某个内存地址时，它通常需要用下面的这种格式来表示：

　　(段基址：段偏移量)

　　物理地址 = 段基址<<4 + 段内偏移

　　所以假设段寄存器中的值是0xff00，段偏移量为0x0110。则这个地址对应的真实物理地址是 0xff00<<4 + 0x0110 = 0xff110。

实模式的"实"更多地体现在其地址是真实的物理地址。

实模式的寻址方式很简单和直观，可以直接软件访问BIOS以及周边硬件，但是也有很多问题，主要就是：安全、多任务支持、cpu 特权模式（任务的权限不同）。比如随便一个程序都能修改别人的内存，别人的程序就挂了，理论上来说，每个人只能访问自己的内存，当然还有高任务级别可以访问低级别的内存等功能。

虽然现代x86处理器已经支持了更灵活的64位和32位操作模式，但为了保持向后兼容性，16位段寄存器仍然存在。这意味着在新的x86架构中，16位段寄存器仍然可以用来加载段选择子，但实际上，大多数操作系统（包括Linux）和应用程序已经不再依赖于分段机制，而是使用分页机制进行内存管理。这允许更灵活的内存管理和更大的虚拟地址空间。

保护模式：

随着CPU的发展，CPU的地址线的个数也从原来的20根变为现在的32根，所以可以访问的内存空间也从1MB变为现在4GB，寄存器的位数也变为32位(除了段寄存器，兼容16位实模式寻址)。所以实模式下的内存地址计算方式就已经不再适合了。但是我们的内存寻址方式还是得兼容老办法(这也是没办法的，有时候是为了方便，有时候是一种无奈)，即(段基址：段偏移量)的表示方式。

所以就引入了现在的保护模式，实现更大空间的，更灵活也更安全的内存访问。

我们的偏移值和实模式下是一样的，就是变成了32位而已，而段值仍旧是存放在原来16位的段寄存器中，但是这些段寄存器存放的却不再是段基址了，实模式下寻址方式不安全，我们在保护模式下需要加一些限制，而这些限制可不是一个寄存器能够容纳的，于是我们把这些关于内存段的限制信息放在一个叫做全局描述符表(GDT)的结构里。全局描述符表中含有多个表项，每一个表项称为段描述符。而段寄存器在保护模式下存放的便是相当于一个数组索引的东西，通过这个索引，可以找到对应的表项。段描述符（全局描述符表的表项）存放了段基址、段界限、内存段类型属性(比如是数据段还是代码段,注意一个段描述符只能用来定义一个内存段)。

相当于一个指针指向数组某个位置，段寄存器（指针）指向全局描述符表（数组）的一个位置，得到段描述符（在全局描述符表找到的表项），里面有段基址。（段寄存器里面不再是段基址，相当于全局描述符表的下标）

那段偏移量呢：

段偏移量不是由代码自己指定的，而是由操作系统或编译器生成的。段偏移量是指在分段存储模型中，指定在特定段内的数据或指令相对于段的起始地址的偏移量。

在x86架构中，当一个段被加载到段寄存器（如CS、DS、ES、SS）中时，该段的偏移量通常是由程序中的内存引用或者汇编指令中的地址自动生成的。这个偏移量是相对于段的基地址来计算的。程序员通常不需要手动指定偏移量，除非他们在编写汇编代码或进行底层内存操作时需要自行计算偏移量。在高级编程语言中，编译器和操作系统通常会自动处理这些细节，使程序员不必担心偏移量的计算。

既然要分段，分段靠的是段基址，但段描述符里面不止有段基址，前辈们对（段描述符）32位的数据进行组合拆分，段基址及其他标志位如下图规定：

这是x86架构中数据段描述符格式的特定设计，这个结构允许描述不同的物理内存段，同时使用相同的高位基地址，以减少冗余。

一些关键位介绍：

段限制（Limit）： 20位字段，指定了段的大小。Linux内核通常将段大小设置为0xFFFFFFFF，以允许对整个物理内存的访问。
访问权限（Access Rights）： 12位字段，定义了段的访问权限和属性。这些位包括：
- 段存在位（Present Bit）： 1位，表示段是否存在。如果为1，表示段存在；为0，表示段不存在。
- **特权级别（Privilege Level）：2位，指定了段的特权级别。0表示内核态，3表示用户态。
- **段类型（Segment Type）：4位，定义段的类型。对于数据段，通常设置为0x2，表示数据读写段。
- **执行许可位（Execute Disable Bit）：1位，对于数据段通常设置为0，表示不允许执行。
- **扩展位（Long Mode Active）：1位，对于64位操作系统（如x86_64），这个位用于表示是否启用了长模式。
- **操作数大小位（Operand Size）：1位，表示段的操作数大小。通常设置为1，表示32位操作数。
- **粒度位（Granularity Bit）：1位，指定段的粒度。通常设置为1，表示使用4KB的粒度。