什么是虚拟内存?

什么是虚拟内存呢?先查一下维基百科:

虚拟内存是计算机系统内存管理的一种技术。它使得应用程序认为它拥有连续可用的内存(一个连续完整的地址空间),而实际上,它通常是被分隔成多个物理内存碎片,还有部分暂时存储在外部磁盘存储器上,在需要时进行数据交换。与没有使用虚拟内存技术的系统相比,使用这种技术的系统使得大型程序的编写变得更容易,对真正的物理内存(例如RAM)的使用也更有效率。

对虚拟内存的定义是基于对地址空间的重定义的,即把地址空间定义为「连续的虚拟内存地址」,以借此「欺骗」程序,使它们以为自己正在使用一大块的「连续」地址。

也就是说虚拟内存能提供一大块连续的地址空间,对程序来说它是连续的,完整的,实际上虚拟内存是映射在多个物理内存碎片上,还有部分映射到了外部磁盘存储器上。虚拟内存有以下两个优点:

1.虚拟内存地址空间是连续的,没有碎片

2.虚拟内存的最大空间就是cup的最大寻址空间,不受内存大小的限制,能提供比内存更大的地址空间

 

虚拟内存是如何工作的呢?

 

创建一个进程时,操作系统(32位系统)会为该进程分配一个4GB 大小的虚拟内存。 之所以是4GB ,是因为在 32 位的操作系统中,一个指针长度是 4 字节(32位, 2的32次方个地址寻址能力是从 0x00000000~0xFFFFFFFF )即为 4GB 大小的容量。

一个进程用到的虚拟地址是由内存区域表来管理的,实际用不了4G。而用到的内存区域,会通过页表映射到物理内存。所以每个进程都可以使用同样的虚拟内存地址而不冲突,因为它们的物理地址实际上是不同的。比如进程A的0x12345678虚拟地址和进程B的的0x12345678虚拟地址映射的物理地址是不同的的。

我们现在使用的64位系统,虚拟内存最大有多大呢?是2的64次方吗?那将会有16EB的虚拟地址空间,1EB有多大呢?1EB = 1,000 PB = 1,000,000 TB =  1,000,000,000 GB 毫无疑问这是个非常巨大的数字,我们的系统根本不需要如此巨大的虚拟内存。现代的操作系统,比如,Windows在AMD64上的实现仅应用了最大256TB的虚拟内存。

cup要访问虚拟内存地址时,需要经过地址翻译成物理地址才能访问。比如下图(来自《深入理解计算机系统》)中,cpu要访问虚拟地址4100,需要通过专用的硬件内存管理单元(memory management unit)MMU来翻译成对应的内存物理地址4,然后cpu在内存地址4的位置上取到数据返回。

 

虚拟内存被分为一块块固定的大小,成为虚拟页(Virtual Page)简称VP,对应的物理内存也被分成一块块同样的大小,成为物理页(Physical Page)简称PP。磁盘和内存之间是以页为单位进行数据交换的。

cpu怎么知道某一个虚拟页是否缓存了数据?缓存在内存中还是磁盘中呢?

这就需要一张表格来记录了,这就是页表。

页表第一列valid 如果是0表示该虚拟页未被缓存,1表示已经缓存了数据。

第二列蓝色的表示数据缓存在内存中,白色的表示数据缓存在磁盘中。

 

页命中

 

当cpu要访问PTE2(箭头所指的位置)的数据时,发现valid标志位为1,所以表示该虚拟页已经被缓存了,由于页表中的地址指向内存中的VP2数据块,所以cpu直接从内存中读取数据VP2,这种情况就叫做页命中。

 

缺页

 

当cpu要访问PTE3(箭头所指的位置)的数据时,发现valid标志位为0,所以表示该虚拟页未被缓存,这时会触发一个缺页异常,cup根据页表第二列的指针找到磁盘中对应的数据块VP3,然后根据规则选择一个内存中的牺牲页,把VP3覆盖到内存中。

 

上图中的内存中的vp4被替换成了VP3,valid的值从0变成1。

 

缺页异常返回后,会重启缺页指令,并更新虚拟地址,cpu再次访问PTE3的时候就能命中页,取到数据了。

 

总结

 

当每个进程创建的时候,内核会为每个进程分配虚拟内存,这个时候数据和代码还在磁盘上,当运行到对应的程序时,进程去寻找页表,如果发现页表中地址没有存放在物理内存上,而是在磁盘上,于是发生缺页异常,于是将磁盘上的数据拷贝到物理内存中并更新页表,下次再访问该虚拟地址时就能命中了。

 

现在你是不是对虚拟内存的工作原理更加了解了呢?

 

 

 

 

 

                                                                            欢迎关注我的公众号

<think>嗯,用户问的是虚拟内存是什么,以及为什么需要它。我得先回忆一下虚拟内存的基本概念。虚拟内存应该是操作系统里的一个机制,用来管理物理内存和磁盘空间的结合使用。可能用户之前在学习计算机基础知识或者操作系统相关内容,所以才会问到这个问题。 首先,我需要解释清楚虚拟内存的定义。虚拟内存允许程序认为自己有连续的可用内存空间,而实际上可能被分割成多个物理内存碎片,甚至部分暂时存储在磁盘上。这样的话,每个程序都好像拥有独立的地址空间,不会互相干扰,这应该是一个关键点。 接下来是为什么需要虚拟内存。可能的原因有几个:比如解决物理内存不足的问题,通过将不常用的内存页交换到磁盘上,从而让更多的程序可以运行。另外,虚拟内存还能提供内存保护,防止程序之间的冲突,提高系统的安全性。还有,它简化了程序开发,因为程序员不需要关心物理内存的实际分配情况,每个程序都像是在独立的内存空间中运行。 用户可能没有说出来的需求是,他们可能在学习操作系统时遇到了虚拟内存的概念,不太明白其作用和存在的必要性,或者在实际编程中遇到了内存相关的问题,想深入了解背后的机制。因此,回答时需要结合实际应用场景,让用户明白虚拟内存的重要性,比如在运行多个程序时的内存管理,或者处理大文件时的内存扩展。 还有可能用户对分页和分段机制不太清楚,需要简要说明虚拟内存是如何通过页表、页面置换算法等实现的。但不需要太深入技术细节,保持解释的易懂性。同时,可能需要提到虚拟内存带来的好处和可能的缺点,比如页面交换导致的性能开销,但总体来说利大于弊。 总结一下,回答的结构应该是先定义虚拟内存,再分点说明为什么需要它,结合实际例子和好处,最后可以简要提及实现机制。确保语言通俗易懂,避免过多专业术语,或者如果使用术语的话,要解释清楚。</think>虚拟内存是操作系统管理物理内存的**核心机制**,其本质是通过软硬件结合的方式,为每个进程构建**连续且独立**的虚拟地址空间。以下是分层解析: --- ### 一、虚拟内存的本质(What) 1. **物理内存抽象化** - 使用$页表(page\ table)$实现虚拟地址到物理地址的映射 - 示例:32位系统提供$4GB$虚拟地址空间($2^{32} = 4,294,967,296$字节) 2. **内存分页机制** $$ 虚拟地址 = 页号(PFN) \| 页内偏移(offset) $$ 通过MMU(内存管理单元)完成地址转换 3. **交换空间支持** 当物理内存不足时,将不活跃的页换出到磁盘的$swap分区$ --- ### 二、虚拟内存存在的必要性(Why) #### (1)突破物理内存限制 - **案例**:运行10个占用1GB内存的进程,物理内存仅8GB 虚拟内存通过交换机制使总内存需求突破$8GB \times 10 = 80GB$ - **实现公式**: $$ 可用内存 = 物理内存 + 交换空间 $$ #### (2)内存安全隔离 ```cpp // 进程A访问0x4000地址时 虚拟地址 -> 页表A -> 物理地址X // 进程B访问同地址0x4000 虚拟地址 -> 页表B -> 物理地址Y ``` 通过独立的页表实现进程间内存隔离 #### (3)简化编程模型 - 程序员无需考虑物理内存分配 - 所有进程都认为自己独占连续地址空间 #### (4)支持内存映射文件 ```bash # Linux系统调用示例 void *mmap(void *addr, size_t length, int prot, int flags, int fd, off_t offset); ``` 将文件直接映射到虚拟地址空间,实现高效I/O --- ### 三、关键技术实现(How) 1. **按需分页** 仅在实际访问时加载物理页,减少初始内存占用 2. **页面置换算法** | 算法 | 特点 | 应用场景 | |-------------|-----------------------------|------------------| | FIFO | 简单但存在Belady异常 | 教学示例 | | LRU | 跟踪最近使用记录 | 数据库缓存 | | Clock | 近似LRU的低开销实现 | 通用操作系统 | 3. **写时复制(Copy-On-Write)** 在进程fork时共享父进程内存,仅在写入时创建副本 --- ### 四、性能影响与优化 - **TLB(Translation Lookaside Buffer)** CPU缓存常用页表项,减少地址转换开销 $$ TLB命中时间 < 1ns,未命中惩罚约10-100ns $$ - **缺页异常处理流程** ```mermaid graph LR A[CPU访问虚拟地址] --> B{页表命中?} B -- 是 --> C[直接访问物理内存] B -- 否 --> D[触发缺页中断] D --> E[加载磁盘页到内存] E --> F[更新页表] F --> C ``` --- ### 五、现代发展延伸 1. **大页(Huge Page)** 使用2MB/1GB页减少TLB miss(Oracle数据库常用) 2. **内存压缩技术** Linux zswap在内存紧张时压缩页面而非换出 3. **非易失性内存支持** Intel Optane持久内存打破传统内存层级 **关键结论**:虚拟内存通过空间换时间、磁盘换空间的策略,在保证安全隔离的前提下,极大提升了内存利用率,是现代操作系统不可或缺的基础设施。
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值