gdb调试执行流程,首先设置断点b sys_clone,当在shell下输入fork命令后,系统执行至断点,接下来按步执行:
- 判断是否被跟踪
- 判断是否被创建为轻量级进程(vfork)
- 判断父进程是否被跟踪,
- 判断是否子进程获取新的PID或命名空间,如果是,则不允许其共享进程组、信号handler或父进程
- task_create在复制之前确认共享的权限
- 调用dup_task_struct复制task_struct(进程描述符)
- alloc_task_struct_node为task_struct分配内存
- alloc_thread_info_node为thread_info分配内存
- setup_thread_stack为进程新建一个内核栈
- copy_semundo
- copy_files
- copy_fs
- copy_sighand
- copy_signal
- copy_mm
- copy_namespaces
- copy_io
- 进入copy_thread
- struct pt_regs *childregs = task_pt_regs(p);给指针赋值,指向.thread.regs
- *childregs = *current_pt_regs();复制寄存器内容
- childregs->ax = 0; 给子进程pid返回值0;
- p->thread.ip = (unsigned long)ret_from_fork;子进程从ret_from_fork开始执行。
- ret_from_fork位于entry.S。子进程执行ret_from_fork后转到syscall_exit
- 父进程copy_thread完成,返回copy_process
- 给新进程分配新pid
- 设置子进程pid
- 子进程接下来进行关中断,检查信号(信号量不共享则不复制),继续restore_all最后恢复上下文,从内核态返回,继续执行程序中的代码。
- 父进程返回sys_clone,父进程执行fork()之后的代码。最后程序结束。
总结:
- 进程(task)是处于执行期的程序,通常还包括打开的文件,挂起的信号,内核内部数据,处理器状态,一个或多个具有内存映射的内存地址空间及一个或多个执行线程,还有存放全局变量的数据段等。
- 线程是在进程中活动的对象。linux:不特别区分进程线程,线程是特殊的进程。
- 在现代Linux内核中,fork实际上是由clone系统调用实现的。
- fork从内核返回两次,一个回到父进程,一次回到产生的新的子进程。
- 程序通过exit()系统调用退出执行。此函数会终结进程并将其占用的资源释放掉。父进程可以通过wait4()系统调用查询子进程是否终结,这使进程拥有了等待特定进程执行完毕的能力。进程退出执行后被设置僵死状态。
- Linux系统通过c库提供wait(),waitpid(),wait3(),wait4()等函数。
- 内核把进程的列表存放在任务队列(task list)双向列表中,表中每项都是task_struct,被称为进程描述符,定义在<linux/sched.h>中。内核通过一个唯一的进程标示值PID来标记进程。PID为pid_t类型,实际为int。
- 进程状态:
- TASK_RUNNING表示进程可执行。
- TASK_INTERRUPTIBLE可中断。进程正在睡眠(阻塞),等待信号。
- TASK_UNINTERRUPTIBLE不可中断。处于此状态不受信号唤醒。其它同上。
- _TASK_TRACED被其他进程跟踪的进程。
- _TASK_STOPPED进程没有投入运行也不能投入运行。
- Unix将产生机制分解为fork和exec。fork复制exec负责读取可执行文件并将其载入地址空间开始运行。
- fork采用写时拷贝页实现。页的拷贝推迟到实际发生写入时。
- 内核有意选择子进程先执行,因为一般子进程马上会调用exec()。以避免写时拷贝的开销。
- 完成fork调用后存在两个进程,每个进程都会从fork()返回处继续执行。
- fork,vfork,clone都调用do_fork,vfork不拷贝父进程的页表。clone带参数。
参考文献:
《Linux内核设计与实现》
By:昆仑雪狐
原创作品转载请注明出处
《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000