Linux云计算集群架构师->第十章-Linux系统进程管理
# 第十章-Linux系统进程管理
(上课时间2021-06-28,笔记整理时间2021-07-03)
**本节所讲内容:**
**10.1 进程概述和 ps 查看进程工具**
**10.2 uptime 查看系统负载-top 动态管理进程**
**10.3 前后台进程切换-nice 进程优先级-实战 screen 后台执行命令**
## 10.1 进程概述和 ps 管理进程
### 10.1.1 什么是进程?
**进程**: 是程序运行的过程, 动态,有生命周期及运行状态,是已启动的可执行程序的运行实例。
进程有以下组成部分:
• 已分配内存的地址空间;
• 安全属性,包括所有权凭据和特权;
• 程序代码的一个或多个执行线程;
• 进程状态
**线程**:进程和线程都是由操作系统所体现的程序运行的基本单元,系统利用该基本单元实现系统对应用的并发性。进程和线程的区别在于:简而言之,一个程序至少有一个进程,一个进程至少有一个线程。
程序: 二进制文件(程序即二进制文件),**静态实体** /bin/date,/usr/sbin/sshd
下图所示的是进程的生命周期:
![image-20210702112402013](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702112402013.png)
父进程复制自己的地址空间(fork [fɔ:k] 分叉)创建一个新的(子)进程结构。每个新进程分配一个唯一的进程 ID (PID),满足跟踪安全性之需。PID 和 父进程 ID (PPID)是子进程环境的元素,任何进程都可以创建子进程,所有进程都是第一个系统进程的后代。
centos5 或 6PID 为 1 的进程是: init
centos7 PID 为 1 的进程是: systemd
centso8 PID 为 1 的进程是: systemd
僵尸进程:一个进程使用 fork 创建子进程,如果子进程退出,而父进程并没有调用 wait 或waitpid 获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵尸进程。
**父进程退出了, 子进程没有退出, 那么这些子进程就没有父进程来管理,就变成僵尸进程。**
### 10.1. 2 进程的属性
**进程 ID(PID)**:是唯一的数值,用来区分进程
**父进程的 ID(PPID)**
**启动进程的用户 ID(UID)和所归属的组(GID)**
**进程状态:状态分为运行 R(running)、休眠 S(sleep)、僵尸 Z(zombie)**
进程执行的优先级
进程所连接的终端名
进程资源占用:比如占用资源大小(内存、CPU 占用量)
### 10.1.3 使用 ps 查看进程工具
**1、ps 查看进程工具**
**常用的参数:**
**a: 显示跟当前终端关联的所有进程**
**u: 基于用户的格式显示(U: 显示某用户 ID 所有的进程)**
**x: 显示所有进程,不以终端机来区分**
```sh
[root@Centos83 ~]# ps -aux | more # ps常用的参数
```
![image-20210702124527462](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702124527462.png)
**最后一列[xxxx] 使用方括号括起来的进程是内核态的进程。 没有括起来的是用户态进程。**
![image-20210702125611402](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702125611402.png)
上面的参数输出每列含意:
USER: 启动这些进程的用户
PID: 进程的 ID
%CPU 进程占用的 CPU 百分比;
%MEM 占用内存的百分比;
VSZ:进程占用的虚拟内存大小(单位:KB)
RSS:进程占用的物理内存大小(单位:KB)
STAT:该程序目前的状态,Linux 进程有 5 种基本状态:
R :该程序目前正在运行,或者是可被运行;
S :该程序目前正在睡眠当中 (可说是 idle 状态啦!),但可被某些讯号(signal) 唤醒。
T :该程序目前正在侦测或者是停止了;
Z :该程序应该已经终止,但是其父程序却无法正常的终止他,造成 zombie (疆尸) 程序的状态
D :不可中断状态.
5 个基本状态后,还可以加一些字母,比如:Ss、Ssl,如下图:
![image-20210702125927390](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702125927390.png)
**它们含意如下:**
**<: 表示进程运行在高优先级上**
**N: 表示进程运行在低优先级上**
**L: 表示进程有页面锁定在内存中**
**s: 表示进程是控制进程**
**l: 表示进程是多线程的**
**+: 表示当前进程运行在前台**
**START:该 process 被触发启动的时间;**
**TIME :该 process 实际使用 CPU 运作的时间。**
**COMMAND:该程序的实际指令**
```sh
[root@Centos83 ~]# vim test.txt # vim 新建一个 test.txt文件
[root@Centos83 ~]# ps -aux | grep test.txt # 用另一个终端查看 查看状态 S 表示睡眠状态, + 表示前台
root 3176 0.0 0.8 49652 8480 pts/0 S+ 13:01 0:00 vim test.txt
root 3218 0.0 0.1 12344 1148 pts/1 S+ 13:02 0:00 grep --color=auto test.txt
[root@Centos83 ~]# ps -aux | grep test.txt # 查看状态 T 表示停止状态
root 3176 0.0 0.8 49652 8580 pts/0 T 13:01 0:00 vim test.txt
root 3245 0.0 0.1 12344 1092 pts/1 S+ 13:05 0:00 grep --color=auto test.txt
```
ctrl-c 是发送 SIGINT 信号,终止一个进程
ctrl-z 是发送 SIGSTOP 信号,挂起一个进程。将作业放置到后台(暂停) 前台进程收到这些信号,就会采取相应动作。
ctrl-d 不是发送信号,而是表示一个特殊的二进制值,表示 EOF。代表输入完成或者注销在 shell 中,ctrl-d 表示退出当前 shell。
```sh
[root@Centos83 ~]# ps -aux | grep tar #然后在另一个终端不断查看状态,由 S+,R+变为 D+
root 3285 6.6 0.3 41488 3388 pts/0 R+ 13:08 0:00 tar -zcvf usr.tar.tz /usr/
root 3288 0.0 0.1 12344 1068 pts/1 S+ 13:08 0:00 grep --color=auto tar
[root@Centos83 ~]# ps -aux | grep tar
root 3285 10.5 0.3 41488 3388 pts/0 S+ 13:08 0:00 tar -zcvf usr.tar.tz /usr/
root 3291 0.0 0.1 12344 1044 pts/1 R+ 13:08 0:00 grep --color=auto tar
[root@Centos83 ~]# ps -aux | grep tar
root 3285 8.8 0.3 41488 3388 pts/0 S+ 13:08 0:00 tar -zcvf usr.tar.tz /usr/
root 3293 0.0 0.1 12344 1152 pts/1 R+ 13:08 0:00 grep --color=auto ta
[root@Centos83 ~]# ps -aux | grep tar
root 3285 8.6 0.3 41488 3388 pts/0 D+ 13:08 0:02 tar -zcvf usr.tar.tz /usr/
root 3295 0.0 0.1 12344 1068 pts/1 S+ 13:09 0:00 grep --color=auto ta
```
2、ps 常用的参数: ps -ef
-e 显示所有进程
-f 显示完整格式输出
我们常用的组合: ps -ef
![image-20210702131125065](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702131125065.png)
包含的信息如下
UID: 启动这些进程的用户,程序被该 UID 所拥有
PID: 该进程的 ID
PPID: 该进程的父进程的 ID
C: 该进程生命周期中的 CPU 使用资源百分比
STIME: 进程启动时的系统时间
TTY: 表明进程在哪个终端设备上运行。如果显示 ?表示与终端无关,这种进程一般是内核态进程。
另外, tty1-tty6 是本机上面的登入者程序,若为 pts/0 等,则表示运行在虚拟终端上的进程。
TIME: 运行进程一共累计占用的 CPU 时间
CMD: 启动的程序名称
测试 CPU 使用时间。
ps aux 是用 BSD 的格式来显示进程。
ps -ef 是用标准的 Unix 格式显示进程
## 10.2 uptime 查看系统负载-top 动态管理进程
### 10.2.1 uptime 查看 CPU 负载工具
```sh
[root@Centos83 ~]# uptime
13:14:05 up 3:09, 2 users, load average: 1.53, 0.98, 0.44
```
弹出消息含意如下:
| 13:14:05 | 当前时间 |
| ------------------------------ | ------------------------------------------------------------ |
| up 3:09 | 系统运行时间 ,说明此服务器连续运行 20 天了 |
| 2 users | 当前登录用户数 |
| load average: 1.53, 0.98, 0.44 | 系统负载,即任务队列的平均长度。三个数值分别为 1 分钟、5 分钟、15 分钟前到现在的平均值。 |
### 10.2.2 top 命令
```sh
[root@Centos83 ~]#top #top
```
弹出的每行信息含意如下:
第一行内容和 uptime 弹出的信息一样
进程和 CPU 的信息( 第二、三行)
![image-20210702131819804](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702131819804.png)
当有多个 CPU 时,这些内容可能会超过两行。内容如下:
Tasks: 227 total, 4 running, 222 sleeping, 1 stopped, 0 zombie
%Cpu(s): 5.9 us, 23.8 sy, 0.0 ni, 25.7 id, 40.6 wa, 2.0 hi, 2.0 si,
MiB Mem : 941.5 total, 89.3 free, 408.1 used, 444.0 buff/ca
MiB Swap: 4096.0 total, 4077.3 free, 18.7 used. 371.8 avail M
| 内容 | 说明 |
| :------------------- | :----------------------------------------------------------- |
| Tasks: 227 total | 进程总数 |
| 4 running | 正在运行的进程数 |
| 222 sleeping | 睡眠的进程数 |
| 1 stopped | 停止的进程数 |
| 0 zombie | 僵尸进程数 |
| %Cpu(s): 5.9 us | 系统用户进程使用 CPU 百分比。 |
| 0.0 sy | 内核中的进程占用 CPU 百分比 |
| 0.0 ni | 用户进程空间内改变过优先级的进程占用 CPU 百分比 |
| 25.7 id | 空闲 CPU 百分比 |
| 40.6 wa | cpu 等待 I/0 完成的时间总量。测试:终端 1:执行:top终端 2:dd if=/dev/zero of=/a.txt count=10 bs=100M终端 3:dd if=/dev/zero of=/a.txt count=10 bs=100M正常读写时,如果 wa 占用较多 CPU,那么就是磁盘性能问题,建议更换磁盘。 |
| 2.0 hi | 硬中断,占用 CPU 百分比。1. 硬中断是由硬件产生的,比如,像磁盘,网卡,键盘,时钟等。每个设备或设备集都有它自己的 IRQ(中断请求)。基于 IRQ(Interrupt Request),CPU 可以将相应的请求分发到对应的硬件驱动上(注:硬件驱动通常是内核中的一个子程序,而不是一个独立的进程)。# hi -> Hardware IRQ: The amount of time the CPU has been servicing hardware interrupts. |
| 2.0 si | 软中断,占用 CPU 百分比。1. 通常,软中断是一些对 I/O 的请求。这些请求会调用内核中可以调度 I/O 发生的程序。对于某些设备,I/O 请求需要被立即处理,而磁盘 I/O 请求通常可以排队并且可以稍后处理。根据 I/O 模型的不同,进程或许会被挂起直到 I/O 完成,此时内核调度器就会选择另一个进程去运行。I/O 可以在进程之间产生并且调度过程通常和磁盘 I/O 的方式是相同。# si -> Software Interrupts.: The amount of time the CPU has been ervicingsoftware interrupts. |
| Mem : 941.5 total | 物理内存总量 |
| 89.3 free | 空闲内存总量 |
| 408.1 used | 使用的物理内存总量 |
| 444.0 buff/ca | 用作内核缓存的内存量。和 free -k 一个意思 |
| Swap: 4096.0 total | 交换区总量 |
| 4077.3 free | 空闲交换区总量 |
| 18.7 used. | 使用的交换区总量 |
| 371.8 avail Mem | 总的可利用内存是多少 |
**注:如果 swap 分区,被使用,那么你的内存不够用了。**
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
![image-20210702200105700](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702200105700.png)
| 列名称 | 说明 |
| ------- | ------------------------------------------------------------ |
| PID | 进程 id |
| USER | 进程所有者的用户名 |
| PR | 优先级(由内核动态调整),用户不能 |
| NI | 进程优先级。 nice 值。负值表示高优先级,正值表示低优先级,用户可以自己调整 |
| VIRT | 虚拟内存,是进程正在使用的所有内存(ps 中标为 VSZ)VIRT:virtual memory usage 虚拟内存 |
| RES | 是进程所使用的物理内存。实际实用内存(ps 中标为 RSS)RES:resident memory usage 常驻内存1、进程当前使用的内存大小,但不包括 swap out2、包含其他进程的共享3、如果申请 100m 的内存,实际使用 10m,它只增长 10m,与VIRT 相反4、关于库占用内存的情况,它只统计加载的库文件所占内存大小 |
| SHR | 共享内存大小,单位 kbSHR:shared memory 共享内存1、除了自身进程的共享内存,也包括其他进程的共享内存2、虽然进程只使用了几个共享库的函数,但它包含了整个共享库的大小3、计算某个进程所占的物理内存大小公式:RES – SHR4、swap out 后,它将会降下来 |
| S | 进程状态。D=不可中断的睡眠状态R=运行中或可运行S=睡眠中T=已跟踪/已停止Z=僵停 |
| %CPU | 上次更新到现在的 CPU 时间占用百分比 |
| %MEM | 进程使用的物理内存百分比 |
| TIME+ | 进程使用的 CPU 时间总计,单位 1/100 秒 |
| COMMAND | 命令名/命令行 |
**top 快捷键:**
**默认 3s 刷新一次,按 s 修改刷新时间**
**按空格 :立即刷新。**
**q 退出**
**P:按 CPU 排序**
**M:按内存排序**
**T 按时间排序**
**p: 进程 pid,查看某个进程状态**
**数字键 1:显示每个内核的 CPU 使用率,展示 cpu 数量,再按下,就收起来了**
**u/U:指定显示的用户**
**h:帮助**
使用 TOP 动态只查看某个或某些进程的信息找到进程 PID
```sh
[root@Centos83 ~]# ps aux | grep vim
root 3176 0.0 0.7 49652 7640 pts/0 T 13:01 0:00 vim test.txt
root 6955 0.0 0.1 12344 1044 pts/1 S+ 20:11 0:00 grep --color=auto vim
[root@Centos83 ~]# top -p 3176
```
### 10.2.3 找出系统中使用 CPU 最多的进程
**运行 top , 找出使用 CPU 最多的进程 ,按大写的 P,可以按 CPU 使用率来排序显示**
![image-20210702201609190](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210702201609190.png)
### 10.2.4 lsof 命令 (netstat -lnput)
lsof 命令用于查看你进程打开的文件,打开文件的进程,进程打开的端口(TCP、UDP)
-i<条件>:列出符合条件的进程。(ipv4、ipv6、协议、:端口、 @ip )
-p<进程号>:列出指定进程号所打开的文件;
```sh
[root@Centos83 ~]# yum -y install lsof #安装lsof
[root@Centos83 ~]# lsof -p 3176 #一般用于查看***进程,在读哪些文件
[root@Centos83 ~]# lsof -i :22 #用于查看端口,或查看***开启的后门端口是哪个进程在使用
```
### 10.2.5 free 显示系统中可用内存和已用内存的数量
**free 命令查看内存使用状态**
**子选项:**
**-b:以字节为单位表示。**
**-k:以 KB 为单位显示,默认是以 KB 为单位显示。**
**-m:以 MB 为单位显示。**
**-g:以 GB 为单位显示。**
```sh
[root@Centos83 ~]# free -m
total used free shared buff/cache available
Mem: 941 271 334 2 335 518
Swap: 4095 133 3962
```
其中:
第一行:total 是总内存量,used 是已经使用的内存量,free 是空闲的内存,shared 是多个进程共享的内存总数,buffers 是缓冲内存数,cache 是缓存内存数。默认单位是 KB。available 实际可用(case 加速读,buffers 加速写。)
第二行开始:total 系统中有 972MB 的物理内存,used 是已经使用的内存数量。free 是空闲的内存数量。shared 是多个进程共享的内存数量。buff/cache 用来作为缓冲和缓存的空间,内核会在内存将要耗尽时释放这部分内存给其他进程使用。availble:可使用空间,评估有多少内存可用于启动新应用程序,不包括 swap,不同于 free 和 cache 字段。available 字段考虑了页缓存,而不是所有可回收的内存。正因为这个原因所以通常 free+buff/cache 的数值要比 available 的数值大。
执行 free 命令查看系统状态,这一瞬间,当前系统,真正,还有多少 M 内存可以使用?
答案 1:free+ buff/cache=69 +299=368M
答案 2:available=123M
## 10.3 前后台进程切换- nice 进程优先级-实战 screen 后台执行命令
### 10.3.1 Linux 后台进程与前台进程的区别
前台进程:是在终端中运行的命令,那么该终端就为进程的控制终端,一旦这个终端关闭,这个进程也随着消失
后台进程: 也叫守护进程(Daemon),是运行在后台的一种特殊进程,不受终端控制,它不需要终端的交互;Linux 的大多数服务器就是用守护进程实现的。比如,Web 服务器 httpd 等。
### 10.3.2 进程的前台与后台运行
跟系统任务相关的几个命令(了解):
| 命令 | 作用 |
| ------------------------ | ------------------------------------------------------------ |
| & | 用在一个命令的最后,可以把这个命令放到后台执行. |
| ctrl + z | 将一个正在前台执行的命令放到后台,并且暂停. |
| jobs | 查看当前有多少在后台运行的进程.它是一个作业控制命令 |
| fg(foreground process) | 将后台中的命令调至前台继续运行, 如果后台中有多个命令,可以用 fg %jobnumber 将选中的命令调出,%jobnumber 是通过 jobs 命令查到的后台正在执行的命令的序号(不是 pid) |
| bg(background process) | 将一个在后台暂停的命令,变成继续执行; 如果后台中有多个命令,可以用bg %jobnumber 将选中的命令调出,%jobnumber 是通过 jobs 命令查到的后台正在执行的命令的序号(不是 pid) |
```sh
[root@Centos83 ~]# vim test.txt # 打开后,然后执行 ctrl+z
[root@Centos83 ~]# jobs # 查看当前有多少在后台运行的进程
[1]+ 已停止 vim test.txt
[root@Centos83 ~]# fg 1 # 将后台挂起的进程恢复到前台运行
```
### 10.3.3 kill 关闭进程
**关闭进程 3 个命令:kill killall pkill**
kill 关闭进程:kill 进程号 关闭单个进程
killall 和 pkill 命令用于杀死指定名字的进程
通过信号的方式来控制进程的
kill -l =====> 列出所有支持的信号(了解) 用最多的是: 9 信号
![image-20210703110627702](https://gitee.com/caoyonghui/Typora/raw/master/Img/image-20210703110627702.png)
| 信号 | 编号 | 信号名 |
| ---- | ------- | -------------------------- |
| 1) | SIGHUP | 重新加载配置 |
| 2) | SIGINT | 键盘中断 crtl+c |
| 3) | SIGQUIT | 退出 |
| 9) | SIGKILL | 强制终止 |
| 15) | SIGTERM | 终止(正常结束),缺省信号 |
| 18) | SIGCONT | 继续 |
| 19) | SIGSTOP | 停止 |
| 20) | SIGTSTP | 暂停 crtl+z |
```sh
# kill 和 killall 终止进程
[root@xuegod63 ~]# kill -9 pid
[root@xuegod63 ~]# killall vim
[root@xuegod63 ~]# pkill vim
```
### 10.3.4 进程的优先级管理
**优先级取值范围为(-20,19),值越小优先级越高, 默认优先级是 0**
**优先级越高占用的 CPU 值就越高**
**命令 1:nice 指定程序的运行优先级**
**格式:nice n command**
**命令 2:renice 改变程序的运行优先级**
**格式:renice -n pid**
指定运行 vim 的优先级为 5
```sh
[root@Centos83 ~]# nice -n 5 vim test.txt
```
输入内容,然后 ctrl+z 挂起
```sh
[root@Centos83 ~]# nice -n 5 vim test.txt
[root@Centos83 ~]# ps -aux | grep vim
root 15346 0.0 0.1 12344 1068 pts/0 S+ 12:18 0:00 grep --color=auto vim
[root@Centos83 ~]# top -p 15346
```
改变正在运行的进程的优先级
### 10.3.5 实战:使用 screen 后台实时执行备份命令
实战场景:公司晚上需要备份 1T 数据,我在 xshell 上直接执行备份脚本 back.sh 可以吗? 或直接运行 back.sh & 放到后台运行可以吗? 当关了 xshell 后,back.sh & 还在后台执行吗?
答:xshell 长时间连接,如果本地网络偶尔断开或 xshell 不小心关闭,都会让后台运行的备份命令停止运行的。
正确做法使用: srceen
### 10.3.6 screen 概述和安装
Screen 中有会话的概念,,用户可以在一个 screen 会话中创建多个 screen 窗口,在每一个 screen窗口中就像操作一个真实的 telnet/SSH 连接窗口那样。
安装 screen 软件包
```sh
[root@Centos83 ~]# rpm -ivh /mnt/AppStream/Packages/scrub-2.5.2-14.el8.x86_64.rpm
```
或者
```sh
[root@Centos83 ~]# yum -y install screen
```
### 10.3.7 screen 使用方法
直接在命令行键入 screen 命令回车
```sh
[root@Centos83 ~]# screen
```
Screen 将创建一个执行 shell 的全屏窗口。你可以执行任意 shell 程序,就像在 ssh 窗口中那样使用 screen 后台实时执行命令备份命令。
```sh
[root@xuegod63 ~]# screen #进入
[root@xuegod63 ~]# vim a.txt #执行命令, 或执行你自己需要运行的备份命令
```
此时想离开一段时间,但还想让这个命令继续运行
```sh
[root@xuegod63 ~]# #在 screen 当前窗口键入快捷键 Ctrl+a+d
[detached from 15885.pts-1.Centos83] #分离出来独立的一个会话
```
detached [dɪˈtætʃt] 分离,独立
```sh
[root@Centos83 ~]# screen -ls #查看已经建立的会话 ID
There is a screen on:
15885.pts-1.Centos83 (Detached)
1 Socket in /run/screen/S-root.
[root@Centos83 ~]# screen -r 15885
[root@Centos83 ~]# exit #不想使用 screen 会话了,执行:exit 退出
exit
[screen is terminating]
```
| **常用 screen 参数** | 作用 |
| -------------------- | --------------------------- |
| screen -S test | 新建一个叫 test 的会话 |
| screen -ls | 列出当前所有的会话 |
| screen -r test | 回到 test 会话 |
| screen -S | 会话 id -X quit -> 删除会话 |
| screen -S | 会话名 -X quit -> 删除会话 |
**总结:**
**10.1 进程概述和 ps 查看进程工具**
**10.2 uptime 查看系统负载-top 动态管理进程**
**10.3 前后台进程切换- nice 进程优先级-实战 screen 后台执行命令**