Linux进程数据结构

  • 对于Linux,无论是进程,还是线程,在内核里面,统一称为任务(Task),由一个统一的结构task_struct进行管理。每一个任务都有一个ID,作为这个任务的唯一标识。

  • Linux可以通过kill来给进程发信号,通知进程退出。在运行中的进程,一旦要进行一些I/O操作,需要等待I/O完毕,这个时候会释放CPU,进入睡眠状态。

  • 在Linux中,有两种睡眠状态:一种是可中断的睡眠状态(TASK_INTERRUPTIBLE),这是一种浅睡眠的状态,即虽然在睡眠,等待I/O完成,但是此时来一个信号,进程还是要被唤醒,但唤醒后,程序员可以自定义是否进行信号处理,还是等待I/O操作完成再进行信号处理;另一种睡眠是不可中断的睡眠状态(TASK_UNINTERRUPTIBLE),这是一种深度睡眠状态,不可被信号唤醒,只能等I/O操作完成,一旦I/O操作因为特殊原因不能完成,此时,该进程再也无法被唤醒,这是比较致命的操作,于是,就有了一种新的进程睡眠状态,可以终止的新睡眠状态(TASK_KILLABLE),进程处于这种状态中,它的运行原理类似 TASK_UNINTERRUPTIBLE,只不过可以响应致命信号。

  • 进程的状态切换往往涉及调度。

  • Linux可以借助用户和用户组控制进程权限,也可以通过capabilities机制控制进程权限。(Capabilities机制,将root用户的权限细分为不同的领域,可以分别启用或禁用,每个线程可以有自己的capabilities,即它细分到线程)

  • 每个进程都有自己独立的虚拟内存空间,这需要一个数据结构来表示,就是mm_struct。

  • 每个进程有一个文件系统的数据结构,还有一个打开文件的数据结构。

  • 在Linux里面,一个进程可以随时通过setuid设置用户ID,setuid是一个权限的特殊标志位,带有这个标志位可以对文件执行等同root的权限。

  • 任何一个进程都有父进程,所以,整个进程其实是一棵进程树。拥有同一父进程的所有进程都具有兄弟关系。

  • task_struct使用链表结构,是为了维护多个task之间的关系:一个task节点的parent指针指向其父进程task,当它终止时,必须向它的父进程发送信号;children表示链表的头部,链表中的所有元素都是它的子进程,所以,children指针指向子进程所有task的头部;sibling指针用于把当前进程插入到兄弟链表中来维护统一级兄弟task。

  • 在进程的内存空间里面,栈是一个从高地址到低地址,往下增长的结构,也就是上面是栈底,下面是栈顶,入栈和出栈的操作都是从下面的栈顶开始的。

  • 在用户态中,程序的执行往往是一个函数调用另一个函数,函数调用都是通过进程内存空间里的栈操作来进行的。

  • 在程序执行过程中,一旦调用到系统调用,就需要进入内核继续执行。内核中各种函数调用需要使用内核栈(stack)机制。Linux给每个task都分配了内核栈。

  • 内核栈结构的最低位置,是一个thread_info结构,它是对task_struct结构的补充。因为task_struct结构庞大但是通用,不同的体系结构就需要保存不同的东西,所以往往与体系结构有关的,都放在thread_info里面。

  • 在内核栈的最高地址端,存放另一个结构pt_regs。当系统调用从用户态到内核态的时候,首先要做的事情,就是将用户态运行过程中的CPU上下文保存起来,其实主要就是保存在这个pt_regs结构的寄存器变量里。这样当从内核系统调用返回的时候,才能让进程在刚才的地方接着运行下去。

Linux进程数据结构

  • CPU用ring来区分权限,从而Linux可以区分内核态和用户态。

  • 多核情况下,CPU是同时运行的,但是它们共同使用其他硬件资源时,需要解决多个CPU之间的同步问题。Per CPU变量是内核中一种重要的同步机制,Per CPU变量就是为每个CPU构造一个变量的副本,这样多个CPU各自操作自己的副本,互不干涉。于是,每个64位CPU运行的task_struct不通过thread_info获取,直接放在Per CPU变量里面。

  • 在用户态,应用程序进行了至少一次函数调用。32位和64位的传递参数的方式稍有不同:32位的就是用函数栈,64位的前6个参数用寄存器,其他的用函数栈;在内核态,32位和64位都使用内核栈,格式也稍有不同,主要集中在pt_regs结构上。

  • 在内核态,32位和64位的内核栈和task_struct的关联关系不同,32位主要靠thread_info,64位主要靠Per-CPU变量。

Linux进程数据结构

上一篇:Linux运维之内存分析


下一篇:Ubuntu初始化配置