虚拟地址空间和进程地址空间的区别
虚拟地址空间是操作系统给进程提供的一个完整的虚拟内存环境,包括内存内核空间和用户空间;而进程地址空间是进程实际使用的那部分虚拟地址空间,只有用户空间。
每个进程地址空间都是虚拟地址空间的一个实例,虚拟地址空间强调整个虚拟内存的管理,包括动态分配、分页和映射等,进程地址空间更关注进程如何使用这些虚拟的地址空间。
进程地址空间
mm_struct
Linux内核中的一个结构体,用于管理进程虚拟地址空间中的那些数据结构。(task_struct中包含mm_struct指针,指向该进程的内存管理结构)
在 Linux 内核中, mm_struct 包含了以下信息:
- 页表(Page tables):用于将虚拟地址映射到物理地址。
- 虚拟内存区域(Virtual memory areas, VMAs):描述进程地址空间中的不同区域,如代码段、数据段、堆、栈等。
- 内存权限和属性:定义了不同内存区域的访问权限,例如可读、可写、可执行等。
- 内存分配策略:描述了进程如何分配和管理内存,包括堆和栈的增长方向。
- 文件映射(File mappings):如果进程映射了文件到其地址空间,这些信息也会被记录在 mm_struct 中。
为什么要有进程地址空间?
1、让父子进程可以用统一的视角看待内存。
(父子进程都分配了一个大小相同的进程地址空间,进程地址空间的区域划分是确定的,堆栈、代码区等,子进程可以将父进程的代码数据在虚拟内存里的安排直接拷贝过来)
2、设置进程地址空间可以让我们访问内存的时候,增加一个转换的过程(虚拟地址通过页表到物理地址的映射)。
在转换过程中,系统可以对寻址请求进行审查,一旦访问异常,直接拦截,该请求不会到达物理内存,保护物理内存。
3、进程地址空间和页表的存在,将进程管理模块和内存管理模块进行解耦合,独立开来。
对地址的认识
1、程序没有加载进内存之前(磁盘里的程序代码)
程序编译好后,一条条的指令已经拥有了各自的地址(在编译链接阶段,由编译器和链接器共同设置),这个地址是逻辑地址。
2、程序加载进内存之后(进程)
被加载进物理内存后,每条指令都要占据内存空间,也就是拥有了物理地址。
进程创建的进程地址空间中的地址就是指令自带的逻辑地址(/虚拟地址),进程运行时,CPU的PC指针就会指向进程地址空间中代码的逻辑入口地址,再通过页表建立 虚拟地址-物理地址的映射,进而找到物理内存中的指令。