Linux云计算集群架构师->第十章-Linux系统进程管理

# 第十章-Linux系统进程管理 (上课时间2021-06-28,笔记整理时间2021-07-03) **本节所讲内容:** **10.1 进程概述和 ps 查看进程工具** **10.2 uptime 查看系统负载-top 动态管理进程** **10.3 前后台进程切换-nice 进程优先级-实战 screen 后台执行命令** ## 10.1 进程概述和 ps 管理进程 ### 10.1.1 什么是进程? **进程**: 是程序运行的过程, 动态,有生命周期及运行状态,是已启动的可执行程序的运行实例。 进程有以下组成部分: • 已分配内存的地址空间; • 安全属性,包括所有权凭据和特权; • 程序代码的一个或多个执行线程; • 进程状态 **线程**:进程和线程都是由操作系统所体现的程序运行的基本单元,系统利用该基本单元实现系统对应用的并发性。进程和线程的区别在于:简而言之,一个程序至少有一个进程,一个进程至少有一个线程。 程序: 二进制文件(程序即二进制文件),**静态实体** /bin/date,/usr/sbin/sshd 下图所示的是进程的生命周期: ![image-20210702112402013](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702112402013.png) 父进程复制自己的地址空间(fork [fɔ:k] 分叉)创建一个新的(子)进程结构。每个新进程分配一个唯一的进程 ID (PID),满足跟踪安全性之需。PID 和 父进程 ID (PPID)是子进程环境的元素,任何进程都可以创建子进程,所有进程都是第一个系统进程的后代。 centos5 或 6PID 为 1 的进程是: init centos7 PID 为 1 的进程是: systemd centso8 PID 为 1 的进程是: systemd 僵尸进程:一个进程使用 fork 创建子进程,如果子进程退出,而父进程并没有调用 wait 或waitpid 获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵尸进程。 **父进程退出了, 子进程没有退出, 那么这些子进程就没有父进程来管理,就变成僵尸进程。** ### 10.1. 2 进程的属性 **进程 ID(PID)**:是唯一的数值,用来区分进程 **父进程的 ID(PPID)** **启动进程的用户 ID(UID)和所归属的组(GID)** **进程状态:状态分为运行 R(running)、休眠 S(sleep)、僵尸 Z(zombie)** 进程执行的优先级 进程所连接的终端名 进程资源占用:比如占用资源大小(内存、CPU 占用量) ### 10.1.3 使用 ps 查看进程工具 **1、ps 查看进程工具** **常用的参数:** **a: 显示跟当前终端关联的所有进程** **u: 基于用户的格式显示(U: 显示某用户 ID 所有的进程)** **x: 显示所有进程,不以终端机来区分** ```sh [root@Centos83 ~]# ps -aux | more # ps常用的参数 ``` ![image-20210702124527462](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702124527462.png) **最后一列[xxxx] 使用方括号括起来的进程是内核态的进程。 没有括起来的是用户态进程。** ![image-20210702125611402](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702125611402.png) 上面的参数输出每列含意: USER: 启动这些进程的用户 PID: 进程的 ID %CPU 进程占用的 CPU 百分比; %MEM 占用内存的百分比; VSZ:进程占用的虚拟内存大小(单位:KB) RSS:进程占用的物理内存大小(单位:KB) STAT:该程序目前的状态,Linux 进程有 5 种基本状态: ​ R :该程序目前正在运行,或者是可被运行; ​ S :该程序目前正在睡眠当中 (可说是 idle 状态啦!),但可被某些讯号(signal) 唤醒。 ​ T :该程序目前正在侦测或者是停止了; ​ Z :该程序应该已经终止,但是其父程序却无法正常的终止他,造成 zombie (疆尸) 程序的状态 ​ D :不可中断状态. 5 个基本状态后,还可以加一些字母,比如:Ss、Ssl,如下图: ![image-20210702125927390](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702125927390.png) **它们含意如下:** **<: 表示进程运行在高优先级上** **N: 表示进程运行在低优先级上** **L: 表示进程有页面锁定在内存中** **s: 表示进程是控制进程** **l: 表示进程是多线程的** **+: 表示当前进程运行在前台** **START:该 process 被触发启动的时间;** **TIME :该 process 实际使用 CPU 运作的时间。** **COMMAND:该程序的实际指令** ```sh [root@Centos83 ~]# vim test.txt # vim 新建一个 test.txt文件 [root@Centos83 ~]# ps -aux | grep test.txt # 用另一个终端查看 查看状态 S 表示睡眠状态, + 表示前台 root 3176 0.0 0.8 49652 8480 pts/0 S+ 13:01 0:00 vim test.txt root 3218 0.0 0.1 12344 1148 pts/1 S+ 13:02 0:00 grep --color=auto test.txt [root@Centos83 ~]# ps -aux | grep test.txt # 查看状态 T 表示停止状态 root 3176 0.0 0.8 49652 8580 pts/0 T 13:01 0:00 vim test.txt root 3245 0.0 0.1 12344 1092 pts/1 S+ 13:05 0:00 grep --color=auto test.txt ``` ctrl-c 是发送 SIGINT 信号,终止一个进程 ctrl-z 是发送 SIGSTOP 信号,挂起一个进程。将作业放置到后台(暂停) 前台进程收到这些信号,就会采取相应动作。 ctrl-d 不是发送信号,而是表示一个特殊的二进制值,表示 EOF。代表输入完成或者注销在 shell 中,ctrl-d 表示退出当前 shell。 ```sh [root@Centos83 ~]# ps -aux | grep tar #然后在另一个终端不断查看状态,由 S+,R+变为 D+ root 3285 6.6 0.3 41488 3388 pts/0 R+ 13:08 0:00 tar -zcvf usr.tar.tz /usr/ root 3288 0.0 0.1 12344 1068 pts/1 S+ 13:08 0:00 grep --color=auto tar [root@Centos83 ~]# ps -aux | grep tar root 3285 10.5 0.3 41488 3388 pts/0 S+ 13:08 0:00 tar -zcvf usr.tar.tz /usr/ root 3291 0.0 0.1 12344 1044 pts/1 R+ 13:08 0:00 grep --color=auto tar [root@Centos83 ~]# ps -aux | grep tar root 3285 8.8 0.3 41488 3388 pts/0 S+ 13:08 0:00 tar -zcvf usr.tar.tz /usr/ root 3293 0.0 0.1 12344 1152 pts/1 R+ 13:08 0:00 grep --color=auto ta [root@Centos83 ~]# ps -aux | grep tar root 3285 8.6 0.3 41488 3388 pts/0 D+ 13:08 0:02 tar -zcvf usr.tar.tz /usr/ root 3295 0.0 0.1 12344 1068 pts/1 S+ 13:09 0:00 grep --color=auto ta ``` 2、ps 常用的参数: ps -ef -e 显示所有进程 -f 显示完整格式输出 我们常用的组合: ps -ef ![image-20210702131125065](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702131125065.png) 包含的信息如下 UID: 启动这些进程的用户,程序被该 UID 所拥有 PID: 该进程的 ID PPID: 该进程的父进程的 ID C: 该进程生命周期中的 CPU 使用资源百分比 STIME: 进程启动时的系统时间 TTY: 表明进程在哪个终端设备上运行。如果显示 ?表示与终端无关,这种进程一般是内核态进程。 另外, tty1-tty6 是本机上面的登入者程序,若为 pts/0 等,则表示运行在虚拟终端上的进程。 TIME: 运行进程一共累计占用的 CPU 时间 CMD: 启动的程序名称 测试 CPU 使用时间。 ps aux 是用 BSD 的格式来显示进程。 ps -ef 是用标准的 Unix 格式显示进程 ## 10.2 uptime 查看系统负载-top 动态管理进程 ### 10.2.1 uptime 查看 CPU 负载工具 ```sh [root@Centos83 ~]# uptime 13:14:05 up 3:09, 2 users, load average: 1.53, 0.98, 0.44 ``` 弹出消息含意如下: | 13:14:05 | 当前时间 | | ------------------------------ | ------------------------------------------------------------ | | up 3:09 | 系统运行时间 ,说明此服务器连续运行 20 天了 | | 2 users | 当前登录用户数 | | load average: 1.53, 0.98, 0.44 | 系统负载,即任务队列的平均长度。三个数值分别为 1 分钟、5 分钟、15 分钟前到现在的平均值。 | ### 10.2.2 top 命令 ```sh [root@Centos83 ~]#top #top ``` 弹出的每行信息含意如下: 第一行内容和 uptime 弹出的信息一样 进程和 CPU 的信息( 第二、三行) ![image-20210702131819804](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702131819804.png) 当有多个 CPU 时,这些内容可能会超过两行。内容如下: Tasks: 227 total, 4 running, 222 sleeping, 1 stopped, 0 zombie %Cpu(s): 5.9 us, 23.8 sy, 0.0 ni, 25.7 id, 40.6 wa, 2.0 hi, 2.0 si, MiB Mem : 941.5 total, 89.3 free, 408.1 used, 444.0 buff/ca MiB Swap: 4096.0 total, 4077.3 free, 18.7 used. 371.8 avail M | 内容 | 说明 | | :------------------- | :----------------------------------------------------------- | | Tasks: 227 total | 进程总数 | | 4 running | 正在运行的进程数 | | 222 sleeping | 睡眠的进程数 | | 1 stopped | 停止的进程数 | | 0 zombie | 僵尸进程数 | | %Cpu(s): 5.9 us | 系统用户进程使用 CPU 百分比。 | | 0.0 sy | 内核中的进程占用 CPU 百分比 | | 0.0 ni | 用户进程空间内改变过优先级的进程占用 CPU 百分比 | | 25.7 id | 空闲 CPU 百分比 | | 40.6 wa | cpu 等待 I/0 完成的时间总量。测试:终端 1:执行:top终端 2:dd if=/dev/zero of=/a.txt count=10 bs=100M终端 3:dd if=/dev/zero of=/a.txt count=10 bs=100M正常读写时,如果 wa 占用较多 CPU,那么就是磁盘性能问题,建议更换磁盘。 | | 2.0 hi | 硬中断,占用 CPU 百分比。1. 硬中断是由硬件产生的,比如,像磁盘,网卡,键盘,时钟等。每个设备或设备集都有它自己的 IRQ(中断请求)。基于 IRQ(Interrupt Request),CPU 可以将相应的请求分发到对应的硬件驱动上(注:硬件驱动通常是内核中的一个子程序,而不是一个独立的进程)。# hi -> Hardware IRQ: The amount of time the CPU has been servicing hardware interrupts. | | 2.0 si | 软中断,占用 CPU 百分比。1. 通常,软中断是一些对 I/O 的请求。这些请求会调用内核中可以调度 I/O 发生的程序。对于某些设备,I/O 请求需要被立即处理,而磁盘 I/O 请求通常可以排队并且可以稍后处理。根据 I/O 模型的不同,进程或许会被挂起直到 I/O 完成,此时内核调度器就会选择另一个进程去运行。I/O 可以在进程之间产生并且调度过程通常和磁盘 I/O 的方式是相同。# si -> Software Interrupts.: The amount of time the CPU has been ervicingsoftware interrupts. | | Mem : 941.5 total | 物理内存总量 | | 89.3 free | 空闲内存总量 | | 408.1 used | 使用的物理内存总量 | | 444.0 buff/ca | 用作内核缓存的内存量。和 free -k 一个意思 | | Swap: 4096.0 total | 交换区总量 | | 4077.3 free | 空闲交换区总量 | | 18.7 used. | 使用的交换区总量 | | 371.8 avail Mem | 总的可利用内存是多少 | **注:如果 swap 分区,被使用,那么你的内存不够用了。** ​ PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND ![image-20210702200105700](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702200105700.png) | 列名称 | 说明 | | ------- | ------------------------------------------------------------ | | PID | 进程 id | | USER | 进程所有者的用户名 | | PR | 优先级(由内核动态调整),用户不能 | | NI | 进程优先级。 nice 值。负值表示高优先级,正值表示低优先级,用户可以自己调整 | | VIRT | 虚拟内存,是进程正在使用的所有内存(ps 中标为 VSZ)VIRT:virtual memory usage 虚拟内存 | | RES | 是进程所使用的物理内存。实际实用内存(ps 中标为 RSS)RES:resident memory usage 常驻内存1、进程当前使用的内存大小,但不包括 swap out2、包含其他进程的共享3、如果申请 100m 的内存,实际使用 10m,它只增长 10m,与VIRT 相反4、关于库占用内存的情况,它只统计加载的库文件所占内存大小 | | SHR | 共享内存大小,单位 kbSHR:shared memory 共享内存1、除了自身进程的共享内存,也包括其他进程的共享内存2、虽然进程只使用了几个共享库的函数,但它包含了整个共享库的大小3、计算某个进程所占的物理内存大小公式:RES – SHR4、swap out 后,它将会降下来 | | S | 进程状态。D=不可中断的睡眠状态R=运行中或可运行S=睡眠中T=已跟踪/已停止Z=僵停 | | %CPU | 上次更新到现在的 CPU 时间占用百分比 | | %MEM | 进程使用的物理内存百分比 | | TIME+ | 进程使用的 CPU 时间总计,单位 1/100 秒 | | COMMAND | 命令名/命令行 | **top 快捷键:** **默认 3s 刷新一次,按 s 修改刷新时间** **按空格 :立即刷新。** **q 退出** **P:按 CPU 排序** **M:按内存排序** **T 按时间排序** **p: 进程 pid,查看某个进程状态** **数字键 1:显示每个内核的 CPU 使用率,展示 cpu 数量,再按下,就收起来了** **u/U:指定显示的用户** **h:帮助** 使用 TOP 动态只查看某个或某些进程的信息找到进程 PID ```sh [root@Centos83 ~]# ps aux | grep vim root 3176 0.0 0.7 49652 7640 pts/0 T 13:01 0:00 vim test.txt root 6955 0.0 0.1 12344 1044 pts/1 S+ 20:11 0:00 grep --color=auto vim [root@Centos83 ~]# top -p 3176 ``` ### 10.2.3 找出系统中使用 CPU 最多的进程 **运行 top , 找出使用 CPU 最多的进程 ,按大写的 P,可以按 CPU 使用率来排序显示** ![image-20210702201609190](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702201609190.png) ### 10.2.4 lsof 命令 (netstat -lnput) lsof 命令用于查看你进程打开的文件,打开文件的进程,进程打开的端口(TCP、UDP) -i<条件>:列出符合条件的进程。(ipv4、ipv6、协议、:端口、 @ip ) -p<进程号>:列出指定进程号所打开的文件; ```sh [root@Centos83 ~]# yum -y install lsof #安装lsof [root@Centos83 ~]# lsof -p 3176 #一般用于查看***进程,在读哪些文件 [root@Centos83 ~]# lsof -i :22 #用于查看端口,或查看***开启的后门端口是哪个进程在使用 ``` ### 10.2.5 free 显示系统中可用内存和已用内存的数量 **free 命令查看内存使用状态** **子选项:** **-b:以字节为单位表示。** **-k:以 KB 为单位显示,默认是以 KB 为单位显示。** **-m:以 MB 为单位显示。** **-g:以 GB 为单位显示。** ```sh [root@Centos83 ~]# free -m total used free shared buff/cache available Mem: 941 271 334 2 335 518 Swap: 4095 133 3962 ``` 其中: 第一行:total 是总内存量,used 是已经使用的内存量,free 是空闲的内存,shared 是多个进程共享的内存总数,buffers 是缓冲内存数,cache 是缓存内存数。默认单位是 KB。available 实际可用(case 加速读,buffers 加速写。) 第二行开始:total 系统中有 972MB 的物理内存,used 是已经使用的内存数量。free 是空闲的内存数量。shared 是多个进程共享的内存数量。buff/cache 用来作为缓冲和缓存的空间,内核会在内存将要耗尽时释放这部分内存给其他进程使用。availble:可使用空间,评估有多少内存可用于启动新应用程序,不包括 swap,不同于 free 和 cache 字段。available 字段考虑了页缓存,而不是所有可回收的内存。正因为这个原因所以通常 free+buff/cache 的数值要比 available 的数值大。 执行 free 命令查看系统状态,这一瞬间,当前系统,真正,还有多少 M 内存可以使用? 答案 1:free+ buff/cache=69 +299=368M 答案 2:available=123M ## 10.3 前后台进程切换- nice 进程优先级-实战 screen 后台执行命令 ### 10.3.1 Linux 后台进程与前台进程的区别 前台进程:是在终端中运行的命令,那么该终端就为进程的控制终端,一旦这个终端关闭,这个进程也随着消失 后台进程: 也叫守护进程(Daemon),是运行在后台的一种特殊进程,不受终端控制,它不需要终端的交互;Linux 的大多数服务器就是用守护进程实现的。比如,Web 服务器 httpd 等。 ### 10.3.2 进程的前台与后台运行 跟系统任务相关的几个命令(了解): | 命令 | 作用 | | ------------------------ | ------------------------------------------------------------ | | & | 用在一个命令的最后,可以把这个命令放到后台执行. | | ctrl + z | 将一个正在前台执行的命令放到后台,并且暂停. | | jobs | 查看当前有多少在后台运行的进程.它是一个作业控制命令 | | fg(foreground process) | 将后台中的命令调至前台继续运行, 如果后台中有多个命令,可以用 fg %jobnumber 将选中的命令调出,%jobnumber 是通过 jobs 命令查到的后台正在执行的命令的序号(不是 pid) | | bg(background process) | 将一个在后台暂停的命令,变成继续执行; 如果后台中有多个命令,可以用bg %jobnumber 将选中的命令调出,%jobnumber 是通过 jobs 命令查到的后台正在执行的命令的序号(不是 pid) | ```sh [root@Centos83 ~]# vim test.txt # 打开后,然后执行 ctrl+z [root@Centos83 ~]# jobs # 查看当前有多少在后台运行的进程 [1]+ 已停止 vim test.txt [root@Centos83 ~]# fg 1 # 将后台挂起的进程恢复到前台运行 ``` ### 10.3.3 kill 关闭进程 **关闭进程 3 个命令:kill killall pkill** kill 关闭进程:kill 进程号 关闭单个进程 killall 和 pkill 命令用于杀死指定名字的进程 通过信号的方式来控制进程的 kill -l =====> 列出所有支持的信号(了解) 用最多的是: 9 信号 ![image-20210703110627702](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210703110627702.png) | 信号 | 编号 | 信号名 | | ---- | ------- | -------------------------- | | 1) | SIGHUP | 重新加载配置 | | 2) | SIGINT | 键盘中断 crtl+c | | 3) | SIGQUIT | 退出 | | 9) | SIGKILL | 强制终止 | | 15) | SIGTERM | 终止(正常结束),缺省信号 | | 18) | SIGCONT | 继续 | | 19) | SIGSTOP | 停止 | | 20) | SIGTSTP | 暂停 crtl+z | ```sh # kill 和 killall 终止进程 [root@xuegod63 ~]# kill -9 pid [root@xuegod63 ~]# killall vim [root@xuegod63 ~]# pkill vim ``` ### 10.3.4 进程的优先级管理 **优先级取值范围为(-20,19),值越小优先级越高, 默认优先级是 0** **优先级越高占用的 CPU 值就越高** **命令 1:nice 指定程序的运行优先级** **格式:nice n command** **命令 2:renice 改变程序的运行优先级** **格式:renice -n pid** 指定运行 vim 的优先级为 5 ```sh [root@Centos83 ~]# nice -n 5 vim test.txt ``` 输入内容,然后 ctrl+z 挂起 ```sh [root@Centos83 ~]# nice -n 5 vim test.txt [root@Centos83 ~]# ps -aux | grep vim root 15346 0.0 0.1 12344 1068 pts/0 S+ 12:18 0:00 grep --color=auto vim [root@Centos83 ~]# top -p 15346 ``` 改变正在运行的进程的优先级 ### 10.3.5 实战:使用 screen 后台实时执行备份命令 实战场景:公司晚上需要备份 1T 数据,我在 xshell 上直接执行备份脚本 back.sh 可以吗? 或直接运行 back.sh & 放到后台运行可以吗? 当关了 xshell 后,back.sh & 还在后台执行吗? 答:xshell 长时间连接,如果本地网络偶尔断开或 xshell 不小心关闭,都会让后台运行的备份命令停止运行的。 正确做法使用: srceen ### 10.3.6 screen 概述和安装 Screen 中有会话的概念,,用户可以在一个 screen 会话中创建多个 screen 窗口,在每一个 screen窗口中就像操作一个真实的 telnet/SSH 连接窗口那样。 安装 screen 软件包 ```sh [root@Centos83 ~]# rpm -ivh /mnt/AppStream/Packages/scrub-2.5.2-14.el8.x86_64.rpm ``` 或者 ```sh [root@Centos83 ~]# yum -y install screen ``` ### 10.3.7 screen 使用方法 直接在命令行键入 screen 命令回车 ```sh [root@Centos83 ~]# screen ``` Screen 将创建一个执行 shell 的全屏窗口。你可以执行任意 shell 程序,就像在 ssh 窗口中那样使用 screen 后台实时执行命令备份命令。 ```sh [root@xuegod63 ~]# screen #进入 [root@xuegod63 ~]# vim a.txt #执行命令, 或执行你自己需要运行的备份命令 ``` 此时想离开一段时间,但还想让这个命令继续运行 ```sh [root@xuegod63 ~]# #在 screen 当前窗口键入快捷键 Ctrl+a+d [detached from 15885.pts-1.Centos83] #分离出来独立的一个会话 ``` detached [dɪˈtætʃt] 分离,独立 ```sh [root@Centos83 ~]# screen -ls #查看已经建立的会话 ID There is a screen on: 15885.pts-1.Centos83 (Detached) 1 Socket in /run/screen/S-root. [root@Centos83 ~]# screen -r 15885 [root@Centos83 ~]# exit #不想使用 screen 会话了,执行:exit 退出 exit [screen is terminating] ``` | **常用 screen 参数** | 作用 | | -------------------- | --------------------------- | | screen -S test | 新建一个叫 test 的会话 | | screen -ls | 列出当前所有的会话 | | screen -r test | 回到 test 会话 | | screen -S | 会话 id -X quit -> 删除会话 | | screen -S | 会话名 -X quit -> 删除会话 | **总结:** **10.1 进程概述和 ps 查看进程工具** **10.2 uptime 查看系统负载-top 动态管理进程** **10.3 前后台进程切换- nice 进程优先级-实战 screen 后台执行命令**
上一篇:The Rust Programming Language - 第17章 Rust的面向对象编程特性 - 17.2 为使用不同类型的值而设计的trait对象


下一篇:全栈性能测试-- -06企业案列解读与技术升华