先看测试代码
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
int main() {
pid_t pid = fork();
if (pid == -1) {
// fork失败
perror("fork failed");
return 1;
} else if (pid > 0) {
// 父进程中
printf("Parent process: PID = %d, Child PID = %d\n", getpid(), pid);
} else {
// 子进程中
printf("Child process: PID = %d\n", getpid());
}
return 0;
}
fork函数在父进程中返回值为子进程号(pid>0),在子进程中返回值为0
实现原理
直到看了linux内核源码后才搞明白了这些问题,fork系统调用在父进程复制出一个子进程,父进程和子进程的PCB信息相同,用户态代码和数据也相同。fork 之后的代码父子进程都会执行,即代码段指向(PC寄存器)是一样的.实际上fork只被父进程调用了一次,子进程并没有执行fork函数,但是却获得了一个返回值,pid == 0,这个非常重要。
_sys_fork: //fork的底层汇编代码,对应的c函数调用是sys_fork
call _find_empty_process
testl %eax,%eax //eax中是PID
js 1f //结果为负则转移
push %gs
pushl %esi
pushl %edi
pushl %ebp
pushl %eax
call _copy_process
addl $20,%esp
1: ret
int copy_process(int nr,long ebp,long edi,long esi,long gs,long none,
long ebx,long ecx,long edx,
long fs,long es,long ds,
long eip,long cs,long eflags,long esp,long ss)
{ //这些参数是int 0x80、system_call sys_fork多次累计压栈的结果,顺序是完全一致的。
struct task_struct *p;
int i;
struct file *f;
//在16MB内存的最高端获取一页,用于进程的task_struct及内核栈,这部分地址在内核空间,用户程序不能访问
p = (struct task_struct *) get_free_page(); //get_free_page从主内存的末端开始向低地址递进。
if (!p)
return -EAGAIN;
task[nr] = p; //此时的nr就是1,nr是新申请的task中可用的槽位号
*p = *current; /* NOTE! this doesn't copy the supervisor stack 只复制了task_struct,并未将4KB都复制,即进程0的内核栈并未复制*/
p->state = TASK_UNINTERRUPTIBLE; //还没设置好,此时不能被调度
p->pid = last_pid;
p->father = current->pid;
p->counter = p->priority;
p->signal = 0;
p->alarm = 0;
p->leader = 0; /* process leadership doesn't inherit */
p->utime = p->stime = 0;
p->cutime = p->cstime = 0;
p->start_time = jiffies;
p->tss.back_link = 0; //开始设置子进程tss
p->tss.esp0 = PAGE_SIZE + (long) p; //esp0是内核栈指针
p->tss.ss0 = 0x10; //0x10就是10000,0特权级,GDT,数据段
p->tss.eip = eip; //是int 0x80压栈的,指向的是:if(_res>=0)
p->tss.eflags = eflags;
p->tss.eax = 0; //返回值,所以在子进程中的for返回值是0
p->tss.ecx = ecx;
p->tss.edx = edx;
p->tss.ebx = ebx;
p->tss.esp = esp;
p->tss.ebp = ebp;
p->tss.esi = esi;
p->tss.edi = edi;
p->tss.es = es & 0xffff;
p->tss.cs = cs & 0xffff;
p->tss.ss = ss & 0xffff;
p->tss.ds = ds & 0xffff;
p->tss.fs = fs & 0xffff;
p->tss.gs = gs & 0xffff;
p->tss.ldt = _LDT(nr);
p->tss.trace_bitmap = 0x80000000;
if (last_task_used_math == current)
__asm__("clts ; fnsave %0"::"m" (p->tss.i387));
if (copy_mem(nr,p)) { //设置子进程的代码段、数据段及创建、复制子进程的第一个页表
task[nr] = NULL;
free_page((long) p);
return -EAGAIN;
}
for (i=0; i<NR_OPEN;i++) //下面将父进程相关属性的引用计数加1,表明父子进程共享文件
if (f=p->filp[i])
f->f_count++;
if (current->pwd)
current->pwd->i_count++;
if (current->root)
current->root->i_count++;
if (current->executable)
current->executable->i_count++;
set_tss_desc(gdt+(nr<<1)+FIRST_TSS_ENTRY,&(p->tss)); //在GDT中设置tss和ldt
set_ldt_desc(gdt+(nr<<1)+FIRST_LDT_ENTRY,&(p->ldt));
p->state = TASK_RUNNING; /* do this last, just in case */
return last_pid;
}
p->tss.eax = 0;这行代码,将子进程的返回值设置为0
return last_pid;这行代码向父进程返回子进程的pid。