fork()+printf(/n)或printf()的区别?

本文探讨了一个关于Unix下fork()系统调用的面试题,通过解析程序行为揭示了输出字符数量背后的原理,特别是涉及缓存机制的影响。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

前两天有人问了个关于Unix的fork()系统调用的面试题,这个题正好是我大约十年前找工作时某公司问我的一个题,我觉得比较有趣,写篇文章与大家分享一下。这个题是这样的:

题目:请问下面的程序一共输出多少个“-”?

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>

int main(void)
{
   int i;
   for(i=0; i<2; i++){
      fork();
      printf("-");
   }

   wait(NULL);
   wait(NULL);

   return 0;
}

如果你对fork()的机制比较熟悉的话,这个题并不难,输出应该是6个“-”,但是,实际上这个程序会很tricky地输出8个“-”。

要讲清这个题,我们首先需要知道fork()系统调用的特性,

  • fork()系统调用是Unix下以自身进程创建子进程的系统调用,一次调用,两次返回,如果返回是0,则是子进程,如果返回值>0,则是父进程(返回值是子进程的pid),这是众为周知的。
  • 还有一个很重要的东西是,在fork()的调用处,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区,等等。

所以,上面的那个程序为什么会输入8个“-”,这是因为printf(“-“);语句有buffer,所以,对于上述程序,printf(“-“);把“-”放到了缓存中,并没有真正的输出(参看《C语言的迷题》中的第一题),在fork的时候,缓存被复制到了子进程空间,所以,就多了两个,就成了8个,而不是6个。

另外,多说一下,我们知道,Unix下的设备有“块设备”和“字符设备”的概念,所谓块设备,就是以一块一块的数据存取的设备,字符设备是一次存取一个字符的设备。磁盘、内存都是块设备,字符设备如键盘和串口。块设备一般都有缓存,而字符设备一般都没有缓存

对于上面的问题,我们如果修改一下上面的printf的那条语句为:

printf("-\n");

或是

 printf("-");
fflush(stdout);

就没有问题了(就是6个“-”了),因为程序遇到“\n”,或是EOF,或是缓中区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。需要注意的是,标准输出是行缓冲,所以遇到“\n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“\n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf来设置缓冲区大小,或是用fflush刷缓存。

我估计有些朋友可能对于fork()还不是很了解,那么我们把上面的程序改成下面这样:

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main(void)
{
   int i;
   for(i=0; i<2; i++){
      fork();
      //注意:下面的printf有“\n”
      printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i);
   }
   sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树
   return 0;
}

于是,上面这段程序会输出下面的结果,(注:编译出的可执行的程序名为fork)

ppid=8858, pid=8518, i=0
ppid=8858, pid=8518, i=1
ppid=8518, pid=8519, i=0
ppid=8518, pid=8519, i=1
ppid=8518, pid=8520, i=1
ppid=8519, pid=8521, i=1

$ pstree -p | grep fork
|-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521)
|            |            `-fork(8520)

面对这样的图你可能还是看不懂,没事,我好事做到底,画个图给你看看:

注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)

这样,对于printf(“-“);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)

现在你明白了吧。(另,对于图中的我本人拙劣的配色,请见谅!)

(全文完)

<think>嗯,用户想比较两个实现ACK等待功能的函数,分别是char WaitACK和char wait_for_ack。首先,我需要分析这两个函数的可能差异。根据用户提供的引用内容,尤其是引用[1]和[2],可能涉及到线程、进程管理者同步机制。比如,引用[1]提到在多线程环境中fork()可能出现的问题,而引用[2]讨论了线程属性设置,如分离状态、调度策略等。这可能意味着函数在处理多线程进程间的同步时有所不同。 接下来,用户提供的引用[3]主要涉及网络配置,如TIME-WAIT状态的socket重用和TCP参数调整。这可能与ACK等待函数的超时设置、连接重用资源管理有关。例如,一个函数可能设置了较短的超时时间,而另一个可能没有正确管理连接状态,导致资源泄漏。 需要进一步考虑的是函数的实现细节。比如,是否使用了阻塞与非阻塞I/O,超时机制如何实现(如使用select、poll还是sleep循环),错误处理方式(如处理ENOSYS其他错误码),以及是否涉及线程同步机制(如互斥锁条件变量)。此外,函数的返回值类型都是char,可能表示不同的状态码,需要查看具体定义。 用户可能希望了解这两个函数在性能、可靠性、资源管理等方面的差异,特别是在高并发高负载情况下的表现。比如,一个函数可能在超时后快速释放资源,而另一个可能因为未正确处理TIME-WAIT状态导致端口占用过多。者,一个函数可能更适合多线程环境,而另一个存在潜在的竞争条件。 另外,根据引用[1]中的内容,如果在多线程环境下调用fork(),而函数内部可能创建了线程,那么需要检查这两个函数是否涉及线程创建,以及是否正确处理了fork后的资源管理。例如,一个函数可能没有设置禁止fork的标志,导致在fork后出现不可预期的行为,从而返回ENOSYS错误。 还需要考虑函数的可移植性。引用[1]提到POSIX兼容性问题,如果函数依赖于特定的库系统调用,可能在跨平台时表现不同。例如,WaitACK可能在某个系统中正确处理了线程和进程的问题,而wait_for_ack可能在另一个系统中有更好的兼容性。 最后,用户可能需要具体的对比点,比如参数、返回值、使用的系统调用、资源管理策略、错误处理等。需要结合代码示例函数定义来详细分析,但由于用户没有提供代码,只能根据常见实现和引用内容推测可能的不同之处。</think>### 比较 `WaitACK` 和 `wait_for_ack` 的实现差异 从函数命名和功能目标来看,两者可能实现类似的ACK等待逻辑,但细节差异可能体现在以下几个方面: --- #### 1. **同步机制与超时控制** - **`WaitACK`**:可能采用阻塞式等待(如 `sleep` 循环)同步I/O操作(如 `select`/`poll`),依赖特定线程/进程的调度策略[^2]。 ```c // 伪代码示例:阻塞式等待 char WaitACK() { while (!ack_received && timeout > 0) { sleep(1); timeout--; } return ack_status; } ``` - **`wait_for_ack`**:可能使用非阻塞式设计(如事件驱动),结合 `pthread` 的条件变量信号量,通过 `pthread_attr_setinheritsched()` 显式控制调度策略[^2]。 ```c // 伪代码示例:条件变量等待 char wait_for_ack() { pthread_mutex_lock(&mutex); while (!ack_received) { pthread_cond_timedwait(&cond, &mutex, timeout); } pthread_mutex_unlock(&mutex); return ack_status; } ``` --- #### 2. **资源管理与错误处理** - **`WaitACK`**:若未正确处理多线程环境下的 `fork()`,可能导致资源泄漏返回 `ENOSYS` 错误(如引用[^1]中描述的线程与 `fork()` 不兼容问题)。 - **`wait_for_ack`**:可能通过 `pthread_attr_setdetachstate()` 设置线程为分离状态(`detached`),避免僵尸线程,同时更严格地处理 `TIME-WAIT` 状态的socket重用(参考引用[^3]的TCP参数优化)。 --- #### 3. **网络协议实现差异** - **`WaitACK`**:可能直接依赖底层TCP的ACK机制(如 `SO_KEEPALIVE` 选项),但未显式管理 `TIME-WAIT` 状态,导致连接资源未快速释放。 - **`wait_for_ack`**:可能结合应用层ACK协议(如自定义重传逻辑),并通过 `net.ipv4.tcp_tw_reuse=1` 和 `net.ipv4.tcp_tw_recycle=1` 优化socket重用。 --- #### 4. **返回值与状态码** - **`WaitACK`**:可能返回简单状态(如 `0` 表示成功,`-1` 表示超时)。 - **`wait_for_ack`**:可能定义更细粒度的错误码(如 `ETIMEDOUT`、`ENOSYS` 自定义错误类型),便于调试多线程网络问题。 --- ### 总结对比表 | **对比项** | **`WaitACK`** | **`wait_for_ack`** | |------------------|-----------------------------------|-----------------------------------| | 同步机制 | 阻塞式循环 | 非阻塞+条件变量/信号量 | | 多线程兼容性 | 可能因 `fork()` 导致问题 | 显式控制线程属性 | | 网络优化 | 依赖TCP默认行为 | 显式重用 `TIME-WAIT` 连接 | | 错误处理 | 简单状态码 | 细粒度错误码 | ---
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值