“万子恵 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000 ”
万子恵 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
实验部分
跟踪调试
1)更新menu
rm menu -rf //强制删除
git clone https://github.com/mengning/menu.git
2)更新test.c
cd menu
mv test_fork.c test.c
3)编译一下
make rootfs //自动编译
调用一下fork
4)调试time
qemu -kernel linux-3.18.6/arch/x86/boot/bzIamge -initrd rootfs.img -s -S
gdb
file linux-3.18.6/linux
target remote:1234
之后设一票断点(重要的部分),但是最后运行时我的实验楼突然卡住了,没能运行出来,这里会用文字和一些老师的图片请见谅
b sys_clone
b dup_task_struct
b copy_process
b copy_thread
b ret_form_fork
总结部分
内核三大功能:
进程管理
文件管理
内核系统
进程描述
进程控制块PCB _ TASK _ STRUCT 进程描述符
1)Linux进程的状态与操作系统原理中的描述的进程状态似乎有所不同,比如就绪状态和运行状态都是TASK_RUNNING
2)我们来看一下task_struct的整体吧~
所有进程链表struct list_head tasks;
程序创建的进程具有父子关系,在编程时往往需要引用这样的父子关系。进程描述符中有几个域用来表示这样的关系
进程创建
1)kernel的两个线程
a.用户态进程启动kernel_init
b.启动kthreadd 所有内核线程的祖先
0号进程(手写)->1号进程(复制0号进程的PCB,根据其修改pid加载init可执行程序)
关于fork
fork一个子进程的代码
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
int main(int argc, char * argv[])
{
int pid;
/* fork another process */
pid = fork();
if (pid < 0)
{
/* error occurred */
fprintf(stderr,"Fork Failed!");
exit(-1);
}
else if (pid == 0)
{
/* child process */
printf("This is Child Process!\n");
}
else
{
/* parent process */
printf("This is Parent Process!\n");
/* parent will wait for the child to complete*/
wait(NULL);
printf("Child Complete!\n");
}
}
fork用户态子进程,else if和else都会被执行哦
在fork后,两个进程,fork系统调用在父子进程个返回一次
1)子 pid=0
2)父 pid=子进程的id
fork、vfork和clone三个系统调用都可以创建一个新进程,而且都是通过调用do_fork来实现进程的创建;
创建一个新进程在内核中的执行过程
系统调用复习
创建新进程是通过当前进程来实现的(不过有一些信息不能一样啦,pid啊,一部分的内核堆栈啊)
Linux通过复制父进程来创建一个新进程,那么这就给我们理解这一个过程提供一个想象的框架:
复制一个PCB——task_struct
err = arch_dup_task_struct(tsk, orig);//复制整个PCB
要给新进程分配一个新的内核堆栈
ti = alloc_thread_info_node(tsk, node);
tsk->stack = ti;
setup_thread_stack(tsk, orig); //这里只是复制thread_info,而非复制内核堆栈
要修改复制过来的进程数据,比如pid、进程链表等等都要改改吧,见copy_process内部。
从用户态的代码看fork();函数返回了两次,即在父子进程中各返回一次,父进程从系统调用中返回比较容易理解,子进程从系统调用中返回,那它在系统调用处理过程中的哪里开始执行的呢?这就涉及子进程的内核堆栈数据状态和task_struct中thread记录的sp和ip的一致性问题,这是在哪里设定的?copy_thread in copy_process
*childregs = *current_pt_regs(); //复制内核堆栈
childregs->ax = 0; //为什么子进程的fork返回0,这里就是原因!
p->thread.sp = (unsigned long) childregs; //调度到子进程时的内核栈顶,拷贝内核堆栈数据和指定新进程的第一条指令地址
p->thread.ip = (unsigned long) ret_from_fork; //调度到子进程时的第一条指令地址(从这句子程序得到CPU时,开始执行)
复制的时候只复制内核堆栈相关的一部分,内核堆栈最栈底
1.阅读理解task _ struct数据结构http://codelab.shiyanlou.com/xref/linux-3.18.6/include/linux/sched.h#1235;
2.分析fork函数对应的内核处理过程sys _ clone,理解创建一个新进程如何创建和修改task_ struct数据结构;
请看总结。
3.使用gdb跟踪分析一个fork系统调用内核处理函数sys_clone ,验证您对Linux系统创建一个新进程的理解,推荐在实验楼Linux虚拟机环境下完成实验。
有实验截图~
4.特别关注新进程是从哪里开始执行的?为什么从哪里能顺利执行下去?即执行起点与内核堆栈如何保证一致。
ret _ from _ fork 因为得到了cpu,复制了相关的信息(init指令和SAVE_ALL压到内核站的内容)设置子进程调度Ip。