【刘蔚然 原创作品转载请注明出处 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000】
WEEK THREE(2.29——3.6)构造一个简单的Linux系统MenuOS
SECTION 1 Linux内核源代码简介
1.操作系统的两把宝剑(回顾上一讲)
- 中断上下文的切换——保存现场&恢复现场
- 进程上下文的切换
2.Linux内核源代码简介
- 打开内核源代码页面
- arch/目录:支持不同CPU的源代码;其中的X86是重点
- init/目录:内核启动相关的代码基本都在该目录中(比如main.c等)
- start_kernel函数就相当于普通C程序的main函数
- kernel/目录:Linux内核核心代码在kernel目录中
- README
- 介绍了什么是Linux,Linux能够在哪些硬件上运行,如何安装内核源代码等
SECTION 2 构造一个简单的Linux系统MenuOS
1.init是第一个用户态进程
2.实验楼环境下的实验步骤
- 进入实验楼,输入$ cd LinuxKernel
- 其中,Linux-3.18.6是最新版本的Linux系统。rootfs是含有init函数的文件,生成的是rootfs.img
- 直接启动kernel。其中 -initrd(指明一个根文件系统) rootfs。我们尝试着输入命令help,可以看到这个系统也会给出有关help命令的参数及说明(虽然比较少哈)
- ()
- ()
- 启动gdb调试
- ()
- 关于参数 - s,- S:
- - S是指在CPU初始化之前(刚启动的时候)将其冻结
- - s是指在1234这个端口上创建的gdb server
- 用水平分割另外打开一个shell窗口之后,进行调试
- 输入gdb之后,gdb即被打开;
- 加载Linux符号表;
- 连接到刚刚被冻结的Linux系统;
- 可以设置断点(break),格式为:break [函数名](此时系统还是被冻结而并没有启动的);
- ()
- 设置完断点之后,输入c命令continue(继续执行),函数会停在断点处(如图);
- 输入list指令之后,可以详细地查看函数停留的位置(比如断点在startkernel处的话停留在501行,而断点设置为restinit之后就停留在394行);
- (
- )
3. 简单分析一下start_kernel
分析一下Linux系统是如何启动的:
- 参考
-
代码节选(分析见注释) 不管分析内核的那一部分都会涉及到start_kernel;因为几乎所有的模块在启动的时候都是通过调用init函数来启动的
500asmlinkage __visible void __init start_kernel(void)
501{
502 char *command_line;
503 char *after_dashes;
504
505 /*
506 * Need to run as early as possible, to initialize the
507 * lockdep hash:
508 */
509 lockdep_init();
510 set_task_stack_end_magic(&init_task);//init_task即手工创建的PCB,0号进程及最终的idle进程
511 smp_setup_processor_id();
512 debug_objects_early_init();
513
514 /*
515 * Set up the the initial canary ASAP:
516 */
517 boot_init_stack_canary();
518
519 cgroup_init_early();
520
521 local_irq_disable();
522 early_boot_irqs_disabled = true;
523
524/*
525 * Interrupts are still disabled. Do necessary setups, then
526 * enable them
527 */
528 boot_cpu_init();
529 page_address_init();
……
setup_log_buf(0);
558 pidhash_init();
559 vfs_caches_init_early();
560 sort_main_extable();
561 trap_init();//初始化中断向量。跟踪此函数,见下方解释
562 mm_init();
……
677 ftrace_init();
678
679 /* Do the rest non-__init'ed, we're now alive */
680 rest_init();//跟踪此函数,见下方解释
681}- 点击追踪561行的trapinit函数,找到x86对应的trapinit函数,可以看到其中设置了很多断点。
- ()
setintrgate就是set interrupt(设置断点)的意思;从图中也可以看到,程序中设置了很多不同的硬件中断。其中,第839行的系统陷阱门就是我们重点关注的系统调用。
restinit中有kernelthread函数:
- ()
- 此函数中有一个函数参数kernel_init:
- ()
- run_init函数是系统的1号进程,用户态的第一个进程;
- 创建了一号进程后,kernel_thread函数通过405行的kthreadd管理线程;
- 由cpustartupentry(CPUHPONLINE);——>cpuidleloop();——>static void cpuidle_loop(void):
- cpuidleloop中有一个while循环,当start_kernel启动之后,她就一直存在。当系统没有进场需要执行的时候就调度到idle进程。
- 总结
- kernelthread是0号进程,它创建了1号进程kernelinit,以及它的一些服务的内核线程,这样整个系统及启动起来了;
- 然后init进程会再启动一些进程。
- 道生一,一生二,二生三,三生万物。系统就这样运行起来了
- 根据CSDN中博客的系统阐述,来龙去脉更加深邃
- inittask进程在Linux中属于一个比较特殊的进程,它是内核开发者人为制造出来的,而不是其他进程通过dofork来完成【这是系统在通电之后就会加载的数据结构struct】
- Linux在无进程概念的情况下将一直从初始化部分的代码执行到startkernel,然后再到其最后一个函数调用restinit【这一点也是和视频中推的是一致的】
- 从restinit开始,Linux开始产生进程,因为inittask是静态制造出来的,pid=0,它试图将从最早的汇编代码一直到startkernel的执行都纳入到inittask进程上下文中。在restinit函数中,内核将通过下面的代码产生第一个真正的进程(pid=1),也就是 kernelthread(kernelinit, NULL, CLONEFS | CLONE_SIGHAND);【0号进程创建1号进程】
- 此时init_task的任务基本上已经完全结束了,它将沦落为一个idle task【很符合操作系统精简一切不必要支出的特征】
- 事实上在更早前的schedinit()函数中,通过initidle(current, smpprocessorid())函数的调用就已经把inittask初始化成了一个idle task,initidle函数的第一个参数current就是&inittask,在initidle中将会把inittask加入到cpu的运行队列中,这样当运行队列中没有别的就绪进程时,inittask(也就是idle task)将会被调用,它的核心是一个while(1)循环,在循环中它将会调用schedule函数以便在运行队列中有新进程加入时切换到该新进程上。【这样就保证了系统可以随时迎接新进程而不至于卡壳】