进程间通信

进程间通信相关概念

什么是进程间通信

Linux 环境下，进程地址空间相互独立，每个进程各自由不同的用户地址空间。任何一个进程的全局变量在另一个进程中都看不到，所以进程和进程之间不能相互访问，要交换数据必须通过内核，在内核种开辟一块缓冲区，进程 1 把数据从用户空间拷贝到内核缓冲区，进程 2 再从内核缓冲区把数据读走，内核提供的这种机制称为进程间通信 (IPC，InterProcess Communication)。

进程间通信的方式

在进程间完成数据传递需要借助操作系统提供特殊的方法，如：文件、管道、信号、共享内存、消息队列、套接字、命名管道等。随着计算机的蓬勃发展，一些方法由于自身设计缺陷被淘汰或者弃用，现今常用的进程间通信方式有：

管道 (使用最简单)
信号 (开销最小)
共享映射区 (无血缘关系)
本地套接字 (最稳定)

管道 - pipe

管道的概念

管道是一种最基本的 IPC 机制，也称匿名管道，应用于有血缘关系的进程之间，完成数据传递。调用 pipe 函数即可创建一个管道。

有如下特质：

管道的本质是一块内核缓冲区
由两个文件描述符引用，一个表示读端，一个表示写端
规定数据从管道的写端流入管道，从读端流出。
当两个进程都终结的时候，管道也自动消失
管道的读端和写端默认都是阻塞的。

管道的原理

管道的实质是内核缓冲区，内部使用环形队列实现。
默认缓冲区大小为 4K，可以使用 ulimit -a 命令获取大小
实际操作过程中缓冲区会根据数据压力做适当调整

管道的局限性

数据一旦被读走，便不在管道中存在，不可反复读取
数据只能在一个方向上流动，若要实现双向流动，必须使用两个管道。
只能在有血缘关系的进程间使用管道。

创建管道 - pipe 函数

函数作用：创建一个管道
函数原型：int pipe(int fd[2]);
函数参数：若函数调用成功，fd[0] 存放管道的读端，fd[1] 存放管道的写端
返回值：
- 成功返回 0
- 失败返回 -1，并设置 errno 值

函数调用成功返回读端和写端的文件描述符，其中 fd[0] 是读端，fd[1] 是写端，向管道读写数据是通过使用这两个文件描述符进行的，读写管道的实质是操作内核缓冲区。

管道创建成功以后，创建该管道的进程 (父进程) 同时掌握着管道的读端和写端。

父子进程使用管道通信

一个进程在由 pipe() 创建管道后，一般再 fork 一个子进程，然后通过管道实现父子进程间的通信 (因此也不难推出，只要两个进程种存在血缘关系，这里的血缘关系指的是具有共同的祖先，都可以采用管道方式进行通信)。父子进程间具有相同的文件描述符，且指向同一个管道 pipe，其他没有关系的进程不能获取 pipe() 产生的两个文件描述符，也就不能利用同一个管道进行通信。

父进程创建管道
父进程 fork 处子进程
父进程关闭 fd[0]，子进程关闭 fd[1]

关键步骤总结：

父进程调用 pipe 函数创建管道，得到两个文件描述符 fd[0] 和 fd[1]，分别指向管道的读端和写端
父进程调用 fork 创建子进程，那么子进程也有两个文件描述符指向同一管道。
父进程关闭管道读端，子进程关闭管道写端。父进程可以向管道中写入数据，子进程将管道中的数据读出，这样就实现了父子进程间通信。

管道的读写行为

读操作
- 有数据
  read 正常读，返回读出的字节数
- 无数据
  - 写端全部关闭
    read 解除阻塞，返回 0，相当于读文件到了尾部
  - 没有全部关闭
    read 阻塞
写操作
- 读端全部关闭
  管道破裂，进程终止，内核给当前进程发 SIGPIPE 信号
- 读端没有全部关闭
  - 缓冲区写满了
    write 阻塞
  - 缓冲区没有满
    继续 write

如何设置管道为非阻塞

默认情况下，管道的读写两端都是阻塞的，若要设置读或者写为非阻塞，则可参考下列三个步骤：

int flags = fcntl(fd[0], F_GETTL, 0);
flags |= O_NONBLOCK;
fcntl(fd[0], F_SETFL, flags);

若是读端设置为非阻塞：

写端没有关闭，管道中没有数据可读，则 read 返回 -1；
写端没有关闭，管道中数据可读，则 read 返回实际读到的字节数
写端已经关闭，管道中有数据可读，则 read 返回实际督导的字节数
写端已经关闭，管道中没有数据可读，则 read 返回 0

如何查看管道缓冲区大小

命令
ulimit -a
函数
long fpathconf(int fd, int name);
printf("pipe size == [%ld]\n", fd[0], _PC_PIPE_BUF);
printf("pipe size == [%ld]\n", fd[1], _PC_PIPE_BUF);

FIFO

FIFO 介绍

FIFO 常被称为命名管道，以区分管道 (pipe)。管道 (pipe) 只能用于 “有血缘关系”的进程间通信。但通过 FIFO，不相关的进程也能交换数据。

FIFO 是 Linux 基础文件类星中的一种 (文件类型为 p，可通过 ls -l 查看文件类型)。但 FIFO 文件在磁盘上没有数据块，文件大小为 0，仅仅用来表示内核中一条通道。进程间可以打开这个文件进行 read/write，实际上是在读写内核缓冲区，这样就实现了进程间通信。

创建管道

方式1 - 使用命令 mkfifo
命令格式：mkfifo 管道名
例如：mkfifo myfifo
方式2 - 使用函数
int mkfifo(const char* pathname, mode_t mode);
参数说明和返回值可以查看 man 3 mkfifo

当创建了一个 FIFO，就可以使用 open 函数打开它，常见的文件 I/O 函数都可用于 FIFO。如：close、read、write、unlink 等。

FIFO 严格遵循先进先出 (first in first out)，对 FIFO 的读总是从开始处返回数据，对他们的写则把数据添加到末尾。它们不支持诸如 lseek() 等文件定位操作。

使用 FIFO 完成两个进程通信

使用 FIFO 完成两个进程通信示意图

思路：

进程 A：
- 创建一个 fifo 文件：myfifo
- 调用 open 函数打开 myfifo 文件
- 调用 write 函数写入一个字符串如： “hello world” (其实就是将数据写入到内核缓冲区)
- 调用 close 函数关闭 myfifo 文件
进程 B：
- 调用 open 函数打开 myfifo 文件
- 调用 read 函数读取文件内容 (其实就是从内核中读取数据)
- 打印显示读取内容
- 调用 close 函数关闭 myfifo 文件

内存映射区

存储映射区介绍

存储映射 I/O (Memory-mapped I/O) 使一个磁盘文件与存储空间中的一个缓冲区像映射。从缓冲区中取数据，就相当于读文件中的相应字节；将数据写入缓冲区，则会将数据写入文件。这样，就可在不使用 read 和 write 函数的情况下，使用地址 (指针) 完成 I/O 操作。

使用存储映射这种方法，首先应通知内核，将一个指定文件映射到存储区域中，这个映射工作可以通过 mmap 函数来实现。

mmap 函数

函数作用：建立存储映射区
函数原型：void* mmap(void* addr, size_t length, int prot, int flags, int fd, off_t offset);
函数返回值：
- 成功：返回创建的映射区首地址
- 失败：MAP_FAILED 、宏
参数：
- addr：指定映射的起始地址，通常设为 NULL，由系统指定
- length：映射到内存的额文件长度
- prot：映射区的保护方式，最常用：
  - 读：PROT_READ
  - 写：PROT_WRITE
  - 读写：PROT_READ | PROT_WRITE
- flags：映射区的特性，可以是
  - MAP_SHARED：写入映射区的数据会写回文件，且允许其他映射该文件的进程共享
  - MAP_PRIVATE：对映射区的写入操作会产生一个映射区的复制 (copy-on-write)，对此区域所做的修改不会写回原文件
- fd：由 open 返回的文件描述符，代表要映射的文件。
- offset：以文件开始处的偏移量，必须是 4K 的正数倍，通常为 0，表示从文件头开始映射

munmap 函数

函数作用：释放由 mmap 函数建立的存储映射区
函数原型：int munmap(void *addr, size_t length)
返回值：
- 成功：返回 0
- 失败：返回 -1，设置 errno 值
函数参数：
- addr：调用 mmap 函数成功返回的映射区首地址
- length：映射区大小 (mmap 函数的第二个参数)

mmap 注意事项

创建映射区的过程中，隐含着一次对映射文件的读操作，将文件内容读取到映射区
当 MAP_SHARED 时，要求：映射区的权限应 <= 文件打开的权限 (出于对映射区的保护)。而 MAP_PRIVATE 则不所谓，因为 mmap 中的权限是对内存的限制。
映射区的释放与文件关闭无关，只要映射建立成功，文件可以立即关闭。
特别注意，当映射文件大小为 0 时，不能创建映射区。所以，用于映射的文件必须要有实际大小；mmap 使用时常常会出现总线错误，通常是由于共享文件存储空间大小引起的。
munmap 传入的地址一定是 mmap 的返回地址。坚决杜绝指针 ++ 操作
文件偏移量必须为 0 或者 4K 的整数倍
mmap 创建映射区出错概率非常高，一定要检查返回值，确保映射区建立成功再进行后续操作。

有关 mmap 函数的使用总结

第一个参数写成 NULL
第二个参数要映射的文件大小 > 0
第三个参数：PROT_READ、PROT_WRITE
第四个参数：MAP_SHARED 或者 MAP_PRIVATE
第五个参数：打开的文件对应的文件描述符
第六个参数：4k 的正数倍

使用 mmap 函数建立匿名映射：
mmap(NULL, 4096, PROT_READ | PROT_WRITE, MAP_SHARED | MAP_ANONYMOUS, -1, 0);

技术

#Linux #C/C++

进程间通信

https://irisislove.github.io/2025/03/26/process-communicate/

作者

Iris

发布于

2025年3月26日

许可协议

信号上一篇

进程控制下一篇