fork函数创建新进程过程分析

gdb调试执行流程,首先设置断点b sys_clone,当在shell下输入fork命令后,系统执行至断点,接下来按步执行:
  1. 判断是否被跟踪
  2. 判断是否被创建为轻量级进程(vfork)
  3. 判断父进程是否被跟踪,
  4. 判断是否子进程获取新的PID或命名空间,如果是,则不允许其共享进程组、信号handler或父进程
  5. task_create在复制之前确认共享的权限
  6. 调用dup_task_struct复制task_struct(进程描述符)
  7. alloc_task_struct_node为task_struct分配内存
  8. alloc_thread_info_node为thread_info分配内存
  9. setup_thread_stack为进程新建一个内核栈
  10. copy_semundo
  11. copy_files
  12. copy_fs
  13. copy_sighand
  14. copy_signal
  15. copy_mm
  16. copy_namespaces
  17. copy_io
  18. 进入copy_thread
  19. struct pt_regs *childregs = task_pt_regs(p);给指针赋值,指向.thread.regs
  20. *childregs = *current_pt_regs();复制寄存器内容
  21. childregs->ax = 0; 给子进程pid返回值0;
  22. p->thread.ip = (unsigned long)ret_from_fork;子进程从ret_from_fork开始执行。
  23. ret_from_fork位于entry.S。子进程执行ret_from_fork后转到syscall_exit
  24. 父进程copy_thread完成,返回copy_process
  25. 给新进程分配新pid
  26. 设置子进程pid
  27. 子进程接下来进行关中断,检查信号(信号量不共享则不复制),继续restore_all最后恢复上下文,从内核态返回,继续执行程序中的代码。
  28. 父进程返回sys_clone,父进程执行fork()之后的代码。最后程序结束。
总结:
  • 进程(task)是处于执行期的程序,通常还包括打开的文件,挂起的信号,内核内部数据,处理器状态,一个或多个具有内存映射的内存地址空间及一个或多个执行线程,还有存放全局变量的数据段等。
  • 线程是在进程中活动的对象。linux:不特别区分进程线程,线程是特殊的进程。
  • 在现代Linux内核中,fork实际上是由clone系统调用实现的。
  • fork从内核返回两次,一个回到父进程,一次回到产生的新的子进程。
  • 程序通过exit()系统调用退出执行。此函数会终结进程并将其占用的资源释放掉。父进程可以通过wait4()系统调用查询子进程是否终结,这使进程拥有了等待特定进程执行完毕的能力。进程退出执行后被设置僵死状态。
  • Linux系统通过c库提供wait(),waitpid(),wait3(),wait4()等函数。
  • 内核把进程的列表存放在任务队列(task list)双向列表中,表中每项都是task_struct,被称为进程描述符,定义在<linux/sched.h>中。内核通过一个唯一的进程标示值PID来标记进程。PID为pid_t类型,实际为int。
  • 进程状态:
    • TASK_RUNNING表示进程可执行。
    • TASK_INTERRUPTIBLE可中断。进程正在睡眠(阻塞),等待信号。
    • TASK_UNINTERRUPTIBLE不可中断。处于此状态不受信号唤醒。其它同上。
    • _TASK_TRACED被其他进程跟踪的进程。
    • _TASK_STOPPED进程没有投入运行也不能投入运行。
  • Unix将产生机制分解为fork和exec。fork复制exec负责读取可执行文件并将其载入地址空间开始运行。
  • fork采用写时拷贝页实现。页的拷贝推迟到实际发生写入时。
  • 内核有意选择子进程先执行,因为一般子进程马上会调用exec()。以避免写时拷贝的开销。
  • 完成fork调用后存在两个进程,每个进程都会从fork()返回处继续执行。
  • fork,vfork,clone都调用do_fork,vfork不拷贝父进程的页表。clone带参数。

参考文献:

《Linux内核设计与实现》

By:昆仑雪狐

原创作品转载请注明出处

《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

上一篇:分治算法及常见示例


下一篇:将YouTube ISO 8601解析为DateTime C#