第六周——分析Linux内核创建一个新进程的过程

2021-08-04 13:49:22

“万子恵 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000 ”

万子恵 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

实验部分

跟踪调试

1)更新menu

 rm menu -rf //强制删除

 git clone https://github.com/mengning/menu.git

2）更新test.c

cd menu

mv test_fork.c test.c

3）编译一下

make rootfs //自动编译

调用一下fork

4）调试time

qemu -kernel linux-3.18.6/arch/x86/boot/bzIamge -initrd rootfs.img -s -S

gdb

file linux-3.18.6/linux

target remote:1234

之后设一票断点（重要的部分），但是最后运行时我的实验楼突然卡住了，没能运行出来，这里会用文字和一些老师的图片请见谅

b sys_clone

b dup_task_struct

b copy_process

b copy_thread

b ret_form_fork

总结部分

内核三大功能：

进程管理

文件管理

内核系统

进程描述

进程控制块PCB _ TASK _ STRUCT 进程描述符

1）Linux进程的状态与操作系统原理中的描述的进程状态似乎有所不同，比如就绪状态和运行状态都是TASK_RUNNING

2）我们来看一下task_struct的整体吧~

所有进程链表struct list_head tasks;

程序创建的进程具有父子关系，在编程时往往需要引用这样的父子关系。进程描述符中有几个域用来表示这样的关系

进程创建

1）kernel的两个线程

a.用户态进程启动kernel_init

b.启动kthreadd 所有内核线程的祖先

0号进程（手写）->1号进程（复制0号进程的PCB，根据其修改pid加载init可执行程序）

关于fork

fork一个子进程的代码

#include <stdio.h>

#include <stdlib.h>

#include <unistd.h>

int main(int argc, char * argv[])

{

    int pid;

    /* fork another process */

    pid = fork();

    if (pid < 0)

    {

        /* error occurred */

        fprintf(stderr,"Fork Failed!");

        exit(-1);

    }

    else if (pid == 0)

    {

        /* child process */

        printf("This is Child Process!\n");

    }

    else

    {

        /* parent process  */

        printf("This is Parent Process!\n");

        /* parent will wait for the child to complete*/

        wait(NULL);

        printf("Child Complete!\n");

    }

}

fork用户态子进程，else if和else都会被执行哦

在fork后，两个进程，fork系统调用在父子进程个返回一次

			1）子 pid=0

			2）父 pid=子进程的id

fork、vfork和clone三个系统调用都可以创建一个新进程，而且都是通过调用do_fork来实现进程的创建；

创建一个新进程在内核中的执行过程

系统调用复习

创建新进程是通过当前进程来实现的（不过有一些信息不能一样啦，pid啊，一部分的内核堆栈啊）

Linux通过复制父进程来创建一个新进程，那么这就给我们理解这一个过程提供一个想象的框架：

复制一个PCB——task_struct

err = arch_dup_task_struct(tsk, orig);//复制整个PCB

要给新进程分配一个新的内核堆栈

ti = alloc_thread_info_node(tsk, node);

tsk->stack = ti;

setup_thread_stack(tsk, orig); //这里只是复制thread_info，而非复制内核堆栈

要修改复制过来的进程数据，比如pid、进程链表等等都要改改吧，见copy_process内部。

从用户态的代码看fork();函数返回了两次，即在父子进程中各返回一次，父进程从系统调用中返回比较容易理解，子进程从系统调用中返回，那它在系统调用处理过程中的哪里开始执行的呢？这就涉及子进程的内核堆栈数据状态和task_struct中thread记录的sp和ip的一致性问题，这是在哪里设定的？copy_thread in copy_process

*childregs = *current_pt_regs(); //复制内核堆栈

childregs->ax = 0; //为什么子进程的fork返回0，这里就是原因！

p->thread.sp = (unsigned long) childregs; //调度到子进程时的内核栈顶，拷贝内核堆栈数据和指定新进程的第一条指令地址

p->thread.ip = (unsigned long) ret_from_fork; //调度到子进程时的第一条指令地址（从这句子程序得到CPU时，开始执行）

复制的时候只复制内核堆栈相关的一部分，内核堆栈最栈底

1.阅读理解task _ struct数据结构http://codelab.shiyanlou.com/xref/linux-3.18.6/include/linux/sched.h#1235；

2.分析fork函数对应的内核处理过程sys _ clone，理解创建一个新进程如何创建和修改task_ struct数据结构；

请看总结。

3.使用gdb跟踪分析一个fork系统调用内核处理函数sys_clone ，验证您对Linux系统创建一个新进程的理解,推荐在实验楼Linux虚拟机环境下完成实验。

有实验截图~

4.特别关注新进程是从哪里开始执行的？为什么从哪里能顺利执行下去？即执行起点与内核堆栈如何保证一致。

ret _ from _ fork 因为得到了cpu，复制了相关的信息（init指令和SAVE_ALL压到内核站的内容）设置子进程调度Ip。

码农公寓