共享内存
共享内存简介
共享内存是所有进程间通信(IPC)手段中速度最快的,不同进程间使用事实上的同一内存区域,这样使得进程间使用信息时免去“复制”这一流程,减少开销。
以下面“进程A从文件f
中读取数据,进行加工之后,将数据传递给进程B”这种场景为例,若使用其他的IPC形式,我们至少需要以下步骤:
1. 从文件f中复制数据到进程A的内存中;
2. 加工数据;
3. 将加工好的数据通过系统调用拷贝到内核空间中;
4. 进程B得知有数据发来,从内核空间将加工好的数据拷贝到进程B的内存中;
5. 进程B使用数据
而我们若使用共享内存,则至少需要以下三个步骤:
1. 从文件f中复制数据到共享内存区域中;
2. 加工数据;
3. 进程B使用数据
显然的,在使用共享内存时,我们减少了一些无意义的数据复制。
不过,在这之中还有一些隐藏在其中影响效率的其他细节——系统调用的数量。在我们使用其他的IPC形式时,读取、写入时将不可避免的使用系统调用,当进行大量的数据吞吐时,频繁的系统调用就会严重地拖累性能。而当我们使用共享内存区域时,可能仅仅需要一个读取内存的开销,或是附加一个同步原语的开销。
除此之外,使用共享内存区域也有一些意外的好处,当进程因为意外退出再重启时,若对共享内存区域使用得当,那么在共享内存区域存放的数据,可以以很小的代价继续使用。
当然,作为代价,共享内存并不具备一些便利性的API,使用共享内存作为IPC形式需要手动的规定共享内存区的“使用协议”,对于有竞争的区域,应当使用信号量等同步原语予以保护。
如何使用
我们以两进程间不存在亲缘关系这种最为“一般”的情况为例,在此时我们可以使用以下两种方式共享内存:
- 内存映射文件
- 共享内存区对象
若两进程之间存在亲缘关系,那么在使用“内存映射文件”这种形式共享内存时,则还可以使用“匿名映射”这一方法,该方法将在下文中陈述。
内存映射文件
mmap函数
内存映射文件用到的函数是mmap
,是的,它是个“身兼多任”的函数,函数原型为:
#include <sys/mman.h>
void *mmap(void *addr, size_t len, int prot, int flags, int fildes, off_t off);
mmap
函数将fildes
参数所指定的文件描述符中从偏移为off
开始持续len
长度的区域以prot
方式保护,映射到当前进程的addr
地址处。若执行成功,那么将返回被映射区的起始地址,反之则返回MAP_FAILED
。
若我们将addr
参数指定为NULL
,则表示我们希望由内核选择一个合适的映射地址,于是通常地我们都将之设定为NULL
。除此之外,我们将mmap
函数作为内存映射文件用于共享内存时,off
参数也通常设为0,这也是很容易理解的,毕竟off
设为其他值除了增大文件之外,在这种情景下毫无意义。
prot
参数可以指定为PROT_READ
(数据可写)、PROT_WRITE
(数据可读)、PROT_EXEC
(数据可执行)、PROT_NONE
(数据不可访问)。一般而言,我们会将其指定为PROT_READ | PROT_WRITE
,表示其可读可写。
flags
参数可以指定为MAP_SHARED
(对于区域的变动是共享的)、MAP_PRIVATE
(对于区域的变动是独自的)和MAP_FIXED
(要求准确的解释addr参数)。对于我们作为共享内存这一用法来说,显然我们应当指定MAP_SHARED
作为参数。
MAP_FIXED
参数的意义可能会使人感到迷惑,何谓准确的解释addr
参数?当我们未指定addr
参数时,内核可能因为内存对齐等其他原因,更改最终映射的地址,也就是说此时addr
参数仅仅是一个参考值,若要保证最终映射的地址一定为addr
参数所指定的地址,则需要设定此参数。不过对于一个良好的、可移植的代码,addr
通常将设定为NULL,也就没有使用MAP_FIXED
的必要。
对于共享内存的使用目的,len
参数就是共享内存区的大小。
当使用完毕之后,我们可以使用munmap
函数解除相应的内存映射,该函数的原型为:
int munmap(void *addr, size_t len);
addr
参数为对应的mmap
函数的返回值,len
与mmap
中len
的意义相同。
建立内存映射文件
在熟悉了mmap
函数的使用之后,简单的谈一谈如何建立内存映射文件,首先,需要使用共享内存的进程使用open
函数打开指定的文件,然后进程使用mmap
将之映射到自己的地址空间中,在mmap
映射建立完成之后,我们就可以使用close
关闭掉文件了,这对于已经建立映射没有影响。
下面是一段代码,使用了内存映射文件,由A进程产生一个随机数并共享给B进程,由B进程打印出来。
// 文件:a.c
#include <fcntl.h>
#include <sys/mman.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h>
void err(const char *str) {
perror(str);
exit(EXIT_FAILURE);
}
int main(int argc, const char *argv[]) {
// (1) 使用open打开指定的内存映射文件
int fd = open("/tmp/example.shm", O_RDWR | O_CREAT, 0666);
if (fd == -1) {
err("open");
}
// (2) 文件可能之前不存在,没有页面,此时直接使用将引发一个bus error
// 先将其截断为指定大小,然后才可以进行相关读取
if (ftruncate(fd, sizeof(int)) == -1) {
err("ftruncate");
}
// (3) 调用mmap将内存映射文件映射到自身的地址空间中
int *p = mmap(NULL, sizeof(int), PROT_WRITE | PROT_READ, MAP_SHARED, fd, 0);
if (p == MAP_FAILED) {
err("mmap");
}
// (4) 完成映射之后可以关闭fd,不影响已经建立的映射
close(fd);
// (5) 产生随机数并存入共享内存中,使用sleep为了便于观察
for (srand(7777);; sleep(1)) {
int v = rand();
*p = v;
printf("produce: %d\n", v);
}