Linux内核分析之操作系统是如何工作的

2023-08-10 18:05:10

在本周的课程中，孟老师主要讲解了操作系统是如何工作的，我根据自己的理解写了这篇博客，请各位小伙伴多多指正。

一、知识点总结

1. 三个法宝

存储程序计算机：所有计算机基础性的逻辑框架。

堆栈：高级语言的起点，函数调用需要堆栈机制。

中断机制：多道系统的基础，是计算机效率提升的关键。

2. 函数调用堆栈

堆栈是C语言程序运行时必须的一个记录调用路径和参数的空间，即CPU内已经集成好了很多功能。

堆栈含以下元素：

函数调用框架

传递参数

保存返回地址（%eax）

提供局部变量空间等等

C语言编译器对堆栈的使用有一套的规则。

堆栈相关的寄存器：

esp，堆栈指针

ebp，基址指针

堆栈操作：

push，栈顶地址减少4个字节（32位）

pop，栈顶地址增加4个字节注：ebp在C语言中用做记录当前函数调用基址。

其他关键寄存器：

cs:eip：指向地址连续的下一条指令

顺序执行：总是指向地址连续的下一条指令

跳转/分支：执行这样的指令的时候，cs:eip的值会根据程序需要被修改

call：将当前cs:eip的值压入栈顶，cs:eip指向被调用函数的入地址

ret：从栈顶弹出原来保存在这里的cs:eip的值，放入cs:eip中发生中断时

二、Mykernel精简内核程序实验

1.实验过程

首先用下面两条命令

 cd LinuxKernel/linux-3.9.

 qemu -kernel arch/x86/boot/bzImage

由图可知：每执行my_ start_ kernel函数一次或两次，my_ time_ hander函数就执行一次。

mymain.c ——系统中唯一的进程。mystartkernel之前的都是硬件初始化的工作，之后是整个操作系统的入口，开始执行操作系统。其中代码完成的工作是每循环10000次，打印一句话。

myinterrupt.c ——时间中断处理程序

每执行一次，都会执行一次时钟中断，每次时钟中断都调用printk并输出。

以上的实验环境仅仅是模拟了时钟中断，一直都是一个进程的run。需要加入下面的代码，才能开始进程切换调度。

需要在mykernel下重新更新文件：myinterrupt.c，主要负责中断以及进程切换；mymain.c，初始化系统环境，mypcb.h描述了进程控制块的定义。

再次到Linux3.9.4目录下重新编译，用下面命令：

 make allnoconfig

 make

 qemu -kernel arch/x86/boot/bzImage

2.进程的启动和进程的切换机制

进程的启动：从void__init my_start_kernel(void)开始启动，函数前面是一些初始化工作，包括对于进程的fork。每个进程初始时，除了pid之外，对于所定义的pcb来说，其他都是相同的，以一个链表来组织各进程。嵌入式汇编代码的主要作用就是初始化第0号进程，将0号进程的esp写入esp寄存器，由于进程还未开始执行，因此进程的esp以及ebp都应该是指向栈底的（空栈），另外，0号进程的eip在这里已经指向了my_process代码段地址，ret之后，开始执行0号进程。

 void __init my_start_kernel(void)

 {

     int pid = ;

     int i;

     /* Initialize process 0*/

     task[pid].pid = pid;

     task[pid].state = ;/* -1 unrunnable, 0 runnable, >0 stopped */

     task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process;

     task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-];

     task[pid].next = &task[pid];

     /*fork more process */

     for(i=;i<MAX_TASK_NUM;i++)

     {

         memcpy(&task[i],&task[],sizeof(tPCB));

         task[i].pid = i;

         task[i].state = -;

         task[i].thread.sp = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-];

         task[i].next = task[i-].next;

         task[i-].next = &task[i];

     }

     /* start process 0 by task[0] */

     pid = ;

     my_current_task = &task[pid];

     asm volatile(

         "movl %1,%%esp\n\t"     /* set task[pid].thread.sp to esp */

         "pushl %1\n\t"          /* push ebp */

         "pushl %0\n\t"          /* push task[pid].thread.ip */

         "ret\n\t"               /* pop task[pid].thread.ip to eip */

         "popl %%ebp\n\t"

         :

         : "c" (task[pid].thread.ip),"d" (task[pid].thread.sp)   /* input c or d mean %ecx/%edx*/

     );

 }

进程的切换：通过schedule()函数进行进程切换，挡发生时钟中断的时候，中断处理程序会将需要调度的flag置为1，而与此同时，每一个当前执行的进程都在轮询，如果一旦flag被置为了1，则开始进行进程切换。case1：进程开始切换的时候，是切换到一个进程状态为已经在运行的进程。在切换进程之前，将1f存到prev的eip中，1f指的是被标记为1的地址，ret之后，弹栈next的eip，开始执行next进程。

 if(next->state == )/* -1 unrunnable, 0 runnable, >0 stopped */

    {

     /* switch to next process */

     asm volatile(

         "pushl %%ebp\n\t"       /* save ebp */

         "movl %%esp,%0\n\t"     /* save esp */

         "movl %2,%%esp\n\t"     /* restore  esp */

         "movl $1f,%1\n\t"       /* save eip */

         "pushl %3\n\t"

         "ret\n\t"               /* restore  eip */

         "1:\t"                  /* next process start here */

         "popl %%ebp\n\t"

         : "=m" (prev->thread.sp),"=m" (prev->thread.ip)

         : "m" (next->thread.sp),"m" (next->thread.ip)

     );

     my_current_task = next;

     printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);

    }

case2：进程切换到一个新进程。由于这里所切换的进程是一个新进程，所以这里的state置为0（running状态），这里的movl $1f，%1\n\t中的1f在进程再次调度回来的时候，走的是case1的分支代码块，所以case2中的中没有标记为1的代码块，也没有pop ebp的操作。

 else

     {

         next->state = ;

         my_current_task = next;

         printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);

         /* switch to new process */

         asm volatile(

             "pushl %%ebp\n\t"       /* save ebp */

             "movl %%esp,%0\n\t"     /* save esp */

             "movl %2,%%esp\n\t"     /* restore  esp */

             "movl %2,%%ebp\n\t"     /* restore  ebp */

             "movl $1f,%1\n\t"       /* save eip */

             "pushl %3\n\t"

             "ret\n\t"               /* restore  eip */

             : "=m" (prev->thread.sp),"=m" (prev->thread.ip)

             : "m" (next->thread.sp),"m" (next->thread.ip)

         );

     }

三、对操作系统如何工作的理解

操作系统是管理计算机系统的全部硬件资源包括软件资源及数据资源;控制程序运行;改善人机界面;为其它应用软件提供支持等，使计算机系统所有资源最大限度地发挥作用，为用户提供方便有效的服务界面。linux内核从一个初始化上下文环境的函数开始执行，即start_kernel函数，创建很多进程或者fork若干进程，当中断发生的时候，如mykernel中就是时钟中断发生之后，接下来OS就会为各进程进行调度，在调度队列中选取出一个适合的进程，由CPU和内核堆栈保存前一个进程的各寄存器信息(进程描述块中的thread结构体保存大部分CPU寄存器，但是诸如eax、ebx等等这些通用寄存器是保存在内和堆栈中的)，将eip指向要调度的进程执行的地址，开始执行。在本次课程中，我对于嵌入汇编的内容仍不熟练，所以为了更深入理解Linux需加强对汇编和操作系统的理解。

刘帅

原创作品转载请注明出处

《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

码农公寓

相关文章