linux进程间信号量通信IPC（sem）、mmap文件内存映射(进程间文件共享)

狮驼岭的小钻风

已于 2023-10-12 14:47:36 修改

阅读量355

点赞数

文章标签： linux java 服务器

于 2023-09-21 14:20:59 首次发布

本文链接：https://blog.youkuaiyun.com/qq_36741413/article/details/133133329

版权

本文详细阐述了信号量在进程间同步中的作用，包括Posix信号量的两种使用场景和特性，以及SystemV信号量的函数。同时介绍了mmap内存映射技术，包括其原理、优点和使用方法，强调了其在提高文件操作效率和进程间通信中的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一、信号量

信号量是一种用于提供不同进程间或一个从给定进程的不同线程间同步手段的原语。
在这里插入图片描述

1.1、Posix信号量的选择

1）单个进程的各个线程共享，可以使用基于内存的信号量。

2）彼此无亲缘关系的不同进程需使用信号量时，通常使用有名信号量。

1.2、基于内存的信号量的持续性

1）如果某个基于内存的信号量是由单个进程的各个线程共享的（sem_init的shared的参数为0），那么该信号量具有随进程的持续性，当该进程终止时它也消失。

2）如果某个基于内存的信号量是在不同进程间共享的（sem_init的shared的参数为1），那么该信号量必须存放在共享内存区中，因而只要该共享内存区任然存在，该信号量也就继续存在。

二、信号量分类

在这里插入图片描述

三、特性

1）互斥锁必须总是由锁住它的线程解锁，信号量的挂出却不必由执行过它的等待操作的同一线程执行。

2）信号量有一个与之关联的状态（计数值），信号量的挂出操作总是被记住。向一个条件变量发送信号时，如果没有线程等待在该条件变量上，那么该信号将丢失（即如果某个线程调用pthread_cond_signal，不过当时没有任何线程阻塞在pthread_cond_wait调用中，那么发往相应条件变量的信号将丢失）。

3）当持有某个信号量锁的进程没有释放该锁就终止时，内核没有自动挂出该信号量。这与记录锁不一样，当持有某个记录锁的进程没有释放它就终止时，内核会自动释放。

四、Posix信号量函数

sem_open()函数    //创建一个新的有名信号量或打开一个已存在的有名信号量。

sem_close()函数
关闭由sem_open()打开的有名信号量。

sem_unlink()函数
从系统中删除有名信号量。

sem_wait()函数
等待信号量，如果该值大于0，那就将它减1并立即返回。如果该值等于0，调用线程就被投入睡眠，知道该值变为大于0，此时再将它减1，函数随后返回。

sem_trywait()函数
当所指定信号量为0时，不将调用线程投入睡眠。而是返回一个EAGAIN错误。

sem_post()函数
把所指定的信号量加1，然后唤醒正在等待该信号量变为正数的任意线程。

int sem_getvalue(sem_t *sem, int *sval);
参数 sem:等待的信号量。
参数 savl:保存所指定信号量的当前值。如果该信号量当前已上锁，那么返回或为0, 或为某个负数（其决定值就是等待该信号量解锁的线程数）

sem_init()函数
基于内存的信号量初始化。

sem_destroy()函数
摧毁基于内存的信号量。

五、System V信号量

在这里插入图片描述

函数说明

smeget()函数
创建一个信号量集或访问一个已存在的信号量集。

semop()函数
对信号量进行操作。

二、mmap

1、mmap简介

mmap是一种内存映射文件的方法，即将一个文件或者其它对象映射到进程的地址空间，实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对映关系。实现这样的映射关系后，进程就可以采用指针的方式读写操作这一段内存，而系统会自动回写脏页面到对应的文件磁盘上，即完成了对文件的操作而不必再调用read,write等系统调用函数。相反，内核空间对这段区域的修改也直接反映用户空间，从而可以实现不同进程间的文件共享。

2、mmap

mmap()必须以PAGE_SIZE(页) 为单位进行映射，而内存也只能以页为单位进行映射，若要映射非PAGE_SIZE整数倍的地址范围，要先进行内存对齐，强行以PAGE_SIZE的倍数大小进行映射。
mmap操作提供了一种机制，让用户程序直接访问设备内存，这种机制，相比较在用户空间和内核空间互相拷贝数据，效率更高。在要求高性能的应用中比较常用。
面向流的设备不能进行mmap，mmap的实现和硬件有关。

头文件：

 #include <sys/mman.h>

函数声明：

void *mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset);
int munmap(void *start, size_t length);

start：映射区的开始地址，设置为0时表示由系统决定映射区的起始地址。
length：映射区的长度。
prot：期望的内存保护标志，不能与文件的打开模式冲突。是以下的某个值，可以通过or运算（“|”）合理地组合在一起。

PROT_EXEC //页内容可以被执行
PROT_READ //页内容可以被读取
PROT_WRITE //页可以被写入
PROT_NONE //页不可访问
flags：指定映射对象的类型，映射选项和映射页是否可以共享。它的值可以是一个或者多个以下位的组合体。

MAP_FIXED //使用指定的映射起始地址，如果由start和len参数指定的内存区重叠于现存的映射空间，重叠部分将会被丢弃。如果指定的起始地址不可用，操作将会失败。
//并且起始地址必须落在页的边界上。
MAP_SHARED //与其它所有映射这个对象的进程共享映射空间。对共享区的写入，相当于输出到文件。直到msync()或者munmap()被调用，文件实际上不会被更新。
MAP_PRIVATE //建立一个写入时拷贝的私有映射。内存区域的写入不会影响到原文件。这个标志和以上标志是互斥的，只能使用其中一个。
MAP_DENYWRITE //这个标志被忽略。
MAP_EXECUTABLE //同上
MAP_NORESERVE //不要为这个映射保留交换空间。当交换空间被保留，对映射区修改的可能会得到保证。当交换空间不被保留，同时内存不足，对映射区的修改会引起段违例信号。
MAP_LOCKED //锁定映射区的页面，从而防止页面被交换出内存。
MAP_GROWSDOWN //用于堆栈，告诉内核VM系统，映射区可以向下扩展。
MAP_ANONYMOUS //匿名映射，映射区不与任何文件关联。
MAP_ANON //MAP_ANONYMOUS的别称，不再被使用。
MAP_FILE //兼容标志，被忽略。
MAP_32BIT //将映射区放在进程地址空间的低2GB，MAP_FIXED指定时会被忽略。当前这个标志只在x86-64平台上得到支持。
MAP_POPULATE //为文件映射通过预读的方式准备好页表。随后对映射区的访问不会被页违例阻塞。
MAP_NONBLOCK //仅和MAP_POPULATE一起使用时才有意义。不执行预读，只为已存在于内存中的页面建立页表入口。
fd：有效的文件描述词。一般是由open()函数返回，其值也可以设置为-1，此时需要指定flags参数中的MAP_ANON,表明进行的是匿名映射。
offset：被映射对象内容的起点。

3、返回值：

成功执行时，mmap()返回被映射区的指针，munmap()返回0。
失败时，mmap()返回MAP_FAILED[其值为(void *)-1]，munmap返回-1。
EACCES：访问出错
EAGAIN：文件已被锁定，或者太多的内存已被锁定
EBADF：fd不是有效的文件描述词
EINVAL：一个或者多个参数无效
ENFILE：已达到系统对打开文件的限制
ENODEV：指定文件所在的文件系统不支持内存映射
ENOMEM：内存不足，或者进程已超出最大内存映射数量
EPERM：权能不足，操作不允许
ETXTBSY：已写的方式打开文件，同时指定MAP_DENYWRITE标志
SIGSEGV：试着向只读区写入
SIGBUS：试着访问不属于进程的内存区

4、优点

1、对文件的读取操作跨过了页缓存，减少了数据的拷贝次数，用内存读写取代I/O读写，提高了文件读取效率。

2、实现了用户空间和内核空间的高效交互方式。两空间的各自修改操作可以直接反映在映射的区域内，从而被对方空间及时捕捉。

3、提供进程间共享内存及相互通信的方式。不管是父子进程还是无亲缘关系的进程，都可以将自身用户空间映射到同一个文件或匿名映射到同一片区域。从而通过各自对映射区域的改动，达到进程间通信和进程间共享的目的。同时，如果进程A和进程B都映射了区域C，当A第一次读取C时通过缺页从磁盘复制文件页到内存中；但当B再读C的相同页面时，虽然也会产生缺页异常，但是不再需要从磁盘中复制文件过来，而可直接使用已经保存在内存中的文件数据。

4、可用于实现高效的大规模数据传输。内存空间不足，是制约大数据操作的一个方面，解决方案往往是借助硬盘空间协助操作，补充内存的不足。但是进一步会造成大量的文件I/O操作，极大影响效率。这个问题可以通过mmap映射很好的解决。换句话说，但凡是需要用磁盘空间代替内存的时候，mmap都可以发挥其功效。