Linux操作系统：程序地址空间的第一讲：对程序地址空间的初步认识_linux的系统函数判断地址是系统空间-优快云博客

本文链接：https://blog.youkuaiyun.com/2302_76267737/article/details/143806321

在第一讲中会有一点陌生的概念，之后的讲解中都会逐渐引出，循序渐进。

一、引入

我们先直接让大家看一个现象，来认识一下什么是地址空间。

先看代码：

代码描述：

我们定义一个全局变量g_val，让父子进程同时打印这个数和这个数的地址，当子进程中的cnt计数到达5次时，我们在在进程中将g_val的值改成300，来观察一下现象。

运行结果：

我们可以看到，在子进程没有改变g_val之前，父子进程打印出来的值都为100，地址也都是一样的，但是当子进程改变g_val的值之后，父进程打印出来的值仍为100，子进程的值变成了300，但是，他们的地址居然是一样的，这就很令人疑惑：为什么地址一样，但是数据不一样。

首先，父子进程中的g_val值不同我们理解：父子进程是相互独立的，既然是相互独立，那么每个进程所拥有的内核数据结构task_struct和其所拥有的代码和数据都应该是相互独立的。

这都好理解，主要是为什么地址一样呢？虽然我们现在不清楚，但是我们知道这个地址绝对不是物理地址，如果是物理地址，那么它在内存的一块空间存着，怎么可能会出现g_val的值既是100又是300的呢？所以这个地址不会是物理地址，那么我们这里要提出一个概念：虚拟地址。

二、对程序空间的基本理解

1、操作系统中的地址空间

在可执行程序被执行之前，我们的可执行程序在磁盘当中，执行时，会将进程对应的代码和数据在内存中开辟一段空间存放进去，这个过程我们已经很熟悉了。

我们的操作系统，在进程运行时会给每个进程分配一个地址空间，里面所存放着的是我们所有变量的地址，这个地址空间在32位下是标准的4G,每一种变量规规矩矩的在地址空间中排列着，我们可以通过这个地址空间中的地址，去找到内存中变量的值。这个地址，就是虚拟地址。

在我们的计算机体系结构中，还有一种与地址空间对应的东西，叫做页表（之后做详细讲解）。

这个页表的工作原理，就是将地址空间的虚拟地址，与内存中变量所在的位置建立映射关系，之后进程通过虚拟地址访问时，操作系统会查页表来找到你要访问的内存中的位置。

2、对上述代码的问题做出解释

程序地址的本质也就是内核数据结构中的一个对象，这样才能先描述，再管理，让操作系统更好的去管理，当进程执行的时候操作系统会将进程代码中与地址空间对应的变量全放到地址空间中，也就是地址空间的属性。我们父进程中有一个已经初始化的g_val全局变量，那么，这个变量的虚拟地址，应该在地址空间的初始化数据模块，并且在内存对应的数据中，有一块g_val的空间。

创建子进程后，我们的子进程会将父进程的地址空间和页表都拷贝一份，这样，我们的子进程也能通过虚拟地址在去页表中在内存中找到对应的g_val的物理地址，进而拿到g_val的值。

所以，在g_val的值没有改变之前，父子进程拿到的g_val的值都是100。

等到子进程要修改g_val的值的时，因为父进程与子进程之间应该是相互独立的，不能被对方影响，所以当g_val的值要被修改时，父进程会看到子进程的这一做法，进而操作系统会介入，会在内存中另一块区域新开辟一块空间，存放的也是g_val的值，并将页表中原来虚拟空间对应的那块物理空间删除，将新开辟空间的地址存入，接着再执行子进程修改g_val的动作，将100变成300。