进程和内存管理
# **进程和内存管理**
![](D:\云计算\17.进程和计划任务\01.png)
* 内核功用:进程管理、内存管理、文件系统、网络功能、驱动程序、安全功能等
~~~sh
#内核和进程的关系
内核把进程存放在叫做任务队列(task list)的双向循环链表中
链表中的每一项都是类型为task_struct,称为进程控制块(Processing Control Block),PCB中包含
一个具体进程的所有信息
~~~
**什么是进程**
~~~sh
Process: 运行中的程序的一个副本,是被载入内存的一个指令集合,是资源分配的单位
进程ID(Process ID,PID)号码被用来标记各个进程
UID、GID、和SELinux语境决定对文件系统的存取和访问权限
通常从执行进程的用户来继承
存在生命周期
进程创建:
init:第一个进程,从 CentOS7 以后为systemd
进程:都由其父进程创建,fork(),父子关系,CoW:Copy On Write
~~~
# 查看是单进程还是多进程
![](D:\云计算\17.进程和计划任务\04.png)
**查看进程中的线程**
![](D:\云计算\17.进程和计划任务\02.png)
~~~sh
方法一
cat /proc/PID/status |grep -i threads
方法二
[root09:58 PMcentos7 ]#pstree -p
systemd(1)─┬─NetworkManager(651)─┬─dhclient(693)
│ ├─{NetworkManager}(665)
│ └─{NetworkManager}(667)
├─atd(654)
├─auditd(615)───{auditd}(616)
├─automount(906)─┬─{automount}(911)
# pidof 进程名 查看进程的PID号
~~~
**进程控制块****PCB****包含信息:**
~~~sh
进程id、用户id和组id
程序计数器
进程的状态(有就绪、运行、阻塞)
进程切换时需要保存和恢复的CPU寄存器的值
描述虚拟地址空间的信息
描述控制终端的信息
当前工作目录
文件描述符表,包含很多指向file结构体的指针
进程可以使用的资源上限(ulimit –a命令可以查看)
输入输出状态:配置进程使用I/O设备
~~~
### 进程和程序区别
~~~sh
程序:一个在磁盘上的文件
进程: 一个正在运行的程序,例如:我打开两个记事本文件,就有两个进程了,但是程序却只有一个
~~~
### 进程、线程、协程
~~~sh
进程是包含线程(thread)的,进程是资源的集合,比如:进程就相当于一家公司,线程就相当于公司里面的员工。公司一个人忙不过来了就找员工来做事了,还用原材料。还有仓库。就相当于数据
协程:比线程还要小
#线程 进程的运行时操作系统安排的,而不是程序员安排的
#协程相当于一个函数,由程序员来安排的,例如调用函数,是由程序员来调用的
~~~
### 上下文切换
~~~sh
CPU切换进程的机制,即从一个进程切换到另外的一个进程不断切换的过程。切来切去导致缓存经常失效,
所以将CPU和进程绑定在一起
#加大内存,最小化安装系统 减少上下文的切换,最小化安装Linux 减少进程之间的通信,将一个进程和CPU绑定
~~~
### CPU时间共享(分时系统)
~~~sh
每颗CPU某一时间只能执行一个进程,将一颗CPU的运行时间切割为时间片,CPU执行一下A进程,停下来执行一下B进程,即每个进程都只执行一会儿,每一段的执行和切换的时间比较短
~~~
### 硬件、操作系统、应用程序的关系
~~~sh
#应用程序不能直接访问硬件上的资源要通过操作系统才能和硬件打交道,操作系统管理硬件资源的分配
~~~
### 页框
~~~sh
磁盘上分配的叫块 block
内存上分配的叫页框,有个最小的分配值,默认是4k
[root@centos8 ~]#getconf -a |grep -i size
~~~
# 面试题:如何通过运行的进程来查找源文件
~~~sh
例如:用ps -aux 发现sshd这个进程的进程号,如何找到程序的磁盘文件
方法:
ll /proc/进程号/exe
~~~
![](D:\云计算\17.进程和计划任务\03.png)
### **物理地址空间和虚拟地址空间**
~~~sh
MMU:Memory Management Unit 负责虚拟地址转换为物理地址
程序在访问一个内存地址指向的内存时,CPU不是直接把这个地址送到内存总线上,而是被送到
MMU(Memory Management Unit),然后把这个内存地址映射到实际的物理内存地址上,然后通过总
线再去访问内存,程序操作的地址称为虚拟内存地址
#每个应用程序都让为他有所有的内存空间
TLB:Translation Lookaside Buffer 翻译后备缓冲器,用于保存虚拟地址和物理地址映射关系的缓存
~~~
![](D:\云计算\17.进程和计划任务\05.png)
### **用户和内核空间**
~~~sh
每一个进程占用的的一部分是用户空间,另外一部分是内核空间
~~~
![](D:\云计算\17.进程和计划任务\06.png)
### 每个进程都包括5种不同的数据段
~~~sh
代码段:用来存放可执行文件的操作指令,也就是说是它是可执行程序在内存中的镜像。代码段需
要防止在运行时被非法修改,所以只准许读取操作,而不允许写入(修改)操作——它是不可写的
数据段:用来存放可执行文件中已初始化全局变量,换句话说就是存放程序静态分配的变量和全局
变量
BSS段:Block Started by Symbol”的缩写,意为“以符号开始的块,BSS段包含了程序中未初始化的
全局变量,在内存中 bss段全部置零
堆(heap):存放数组和对象,堆是用于存放进程运行中被动态分配的内存段,它的大小并不固
定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆
上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减) #后进先出
栈:栈是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括
static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会
被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的后
进先出特点,所以栈特别方便用来保存/恢复调用现场。可以把堆栈看成一个寄存、交换临时数据
的内存区
~~~
### **进程使用内存问题**
* **1.3.4.1** **内存泄漏:****Memory Leak**
指程序中用malloc或new申请了一块内存,但是没有用free或delete将内存释放,导致这块内存一直处
于占用状态
* **1.3.4.2** **内存溢出:****Memory Overflflow**
指程序申请了10M的空间,但是在这个空间写入10M以上字节的数据,就是溢出
* **1.3.4.3** **内存不足:****OOM**
OOM 即 Out Of Memory,“内存用完了”,在情况在java程序中比较常见。系统会选一个进程将之杀死,
在日志messages中看到类似下面的提示
**Jul 10 10:20:30 kernel: Out of memory: Kill process 9527 (java) score 88 or sacrififice child**
当JVM因为没有足够的内存来为对象分配空间并且垃圾回收器也已经没有空间可回收时,就会抛出这个
error,因为这个问题已经严重到不足以被应用处理)。
原因:
给应用分配内存太少:比如虚拟机本身可使用的内存(一般通过启动时的VM参数指定)太少。
应用用的太多,并且用完没释放,浪费了。此时就会造成内存泄露或者内存溢出。
使用的解决办法:
1,限制java进程的max heap,并且降低java程序的worker数量,从而降低内存使用
2,给系统增加swap空间
设置内核参数(不推荐),不允许内存申请过量:
~~~sh
echo 2 > /proc/sys/vm/overcommit_memory
echo 80 > /proc/sys/vm/overcommit_ratio
echo 2 > /proc/sys/vm/panic_on_oom
~~~
说明:
Linux默认是允许memory overcommit的,只要你来申请内存我就给你,寄希望于进程实际上用不到那
么多内存,但万一用到那么多了呢?Linux设计了一个OOM killer机制挑选一个进程出来杀死,以腾出
部分内存,如果还不够就继续。也可通过设置内核参数 vm.panic_on_oom 使得发生OOM时自动重启
系统。这都是有风险的机制,重启有可能造成业务中断,杀死进程也有可能导致业务中断。所以Linux
2.6之后允许通过内核参数 vm.overcommit_memory 禁止memory overcommit。
vm.panic_on_oom 决定系统出现oom的时候,要做的操作。接受的三种取值如下:
~~~sh
0 - 默认值,当出现oom的时候,触发oom killer
1 - 程序在有cpuset、memory policy、memcg的约束情况下的OOM,可以考虑不panic,而是启动OOM
killer。其它情况触发 kernel panic,即系统直接重启
2 - 当出现oom,直接触发kernel panic,即系统直接重启
~~~
### vm.overcommit_memory 接受三种取值:
~~~sh
0 – Heuristic overcommit handling. 这是缺省值,它允许overcommit,但过于明目张胆的
overcommit会被拒绝,比如malloc一次性申请的内存大小就超过了系统总内存。Heuristic的意思是“试
探式的”,内核利用某种算法猜测你的内存申请是否合理,它认为不合理就会拒绝overcommit。
1 – Always overcommit. 允许overcommit,对内存申请来者不拒。内核执行无内存过量使用处理。使
用这个设置会增大内存超载的可能性,但也可以增强大量使用内存任务的性能。
2 – Don’t overcommit. 禁止overcommit。 内存拒绝等于或者大于总可用 swap 大小以及
overcommit_ratio 指定的物理 RAM 比例的内存请求。如果您希望减小内存过度使用的风险,这个设置就
是最好的。
~~~
Heuristic overcommit算法:
单次申请的内存大小不能超过以下值,否则本次申请就会失败。
~~~sh
free memory + free swap + pagecache的大小 + SLAB
~~~
vm.overcommit_memory=2 禁止overcommit,那么怎样才算是overcommit呢?
kernel设有一个阈值,申请的内存总数超过这个阈值就算overcommit,在/proc/meminfo中可以看到
这个阈值的大小
~~~sh
grep -i commit /proc/meminfCommitLimit: 5967744 kBCommittedAS: 5363236 kB
~~~
CommitLimit 就是overcommit的阈值,申请的内存总数超过CommitLimit的话就算是overcommit。
此值通过内核参数vm.overcommit_ratio或vm.overcommit_kbytes间接设置的,公式如下:
~~~sh
CommitLimit = (Physical RAM * vm.overcommit_ratio / 100) + Swap
~~~
vm.overcommit_ratio 是内核参数,缺省值是50,表示物理内存的50%。如果你不想使用比率,也可以
直接指定内存的字节数大小,通过另一个内核参数 vm.overcommit_kbytes 即可;
如果使用了huge pages,那么需要从物理内存中减去,公式变成:
~~~sh
CommitLimit = ([total RAM] – [total huge TLB RAM]) * vm.overcommit_ratio / 100 +
swap
~~~
/proc/meminfo中的 Committed_AS 表示所有进程已经申请的内存总大小,(注意是已经申请的,不
是已经分配的),如果 Committed_AS 超过 CommitLimit 就表示发生了 overcommit,超出越多表示
overcommit 越严重。Committed_AS 的含义换一种说法就是,如果要绝对保证不发生OOM (out of
memory) 需要多少物理内存。
~~~sh
[root@centos8 ~]#cat /proc/sys/vm/panic_on_oom
0
[root@centos8 ~]#cat /proc/sys/vm/overcommit_memory
0
[root@centos8 ~]#cat /proc/sys/vm/overcommit_ratio
50
[root@centos8 ~]#grep -i commit /proc/meminfo
CommitLimit: 3021876 kB
Committed_AS: 340468 kB
~~~
## **进程状态**
![](D:\云计算\17.进程和计划任务\07.png)
**进程的基本状态**
* 创建状态:进程在创建时需要申请一个空白PCB(process control block进程控制块),向其中填写
控制和管理进程的信息,完成资源分配。如果创建工作无法完成,比如资源无法满足,就无法被调
度运行,把此时进程所处状态称为创建状态
* 就绪状态:进程已准备好,已分配到所需资源,只要分配到CPU就能够立即运行
* 执行状态:进程处于就绪状态被调度后,进程进入执行状态
* 阻塞状态:正在执行的进程由于某些事件(I/O请求,申请缓存区失败)而暂时无法运行,进程受
到阻塞。在满足请求时进入就绪状态等待系统调用
* 终止状态:进程结束,或出现错误,或被系统终止,进入终止状态。无法再执行
**状态之间转换六种情况**
运行——>就绪:1,主要是进程占用CPU的时间过长,而系统分配给该进程占用CPU的时间是有限的;
2,在采用抢先式优先级调度算法的系统中,当有更高优先级的进程要运行时,该进程就*让出CPU,
该进程便由执行状态转变为就绪状态
就绪——>运行:运行的进程的时间片用完,调度就转到就绪队列中选择合适的进程分配CPU
运行——>阻塞:正在执行的进程因发生某等待事件而无法执行,则进程由执行状态变为阻塞状态,如
发生了I/O请求
阻塞——>就绪:进程所等待的事件已经发生,就进入就绪队列
以下两种状态是不可能发生的:
阻塞——>运行:即使给阻塞进程分配CPU,也无法执行,操作系统在进行调度时不会从阻塞队列进行
挑选,而是从就绪队列中选取
就绪——>阻塞:就绪态根本就没有执行,谈不上进入阻塞态
### **进程更多的状态:**
运行态:running
就绪态:ready
S 睡眠态:分为两种,可中断:interruptable,不可中断:uninterruptable 大部分的进程都是睡眠态,等待CPU安排任务
T 停止态:stopped,暂停于内存,但不会被调度,除非手动启动,程序主机无法醒过来
Z 僵死态:zombie,僵尸态,结束进程,父进程结束前,子进程不关闭,杀死父进程可以关闭僵死
态 的子进程
~~~sh
僵尸态
[root@centos8 ~]#bash
[root@centos8 ~]#echo $BASHPID
1809
[root@centos8 ~]#echo $PPID
1436
#将父进程设为停止态
[root@centos8 ~]#kill -19 1436
#杀死子进程,使其进入僵尸态
[root@centos8 ~]#kill 1809
[root@centos8 ~]#ps aux
清理僵死态进程:
#恢复或杀死父进程
[root@centos8 ~]#kill -18 1436
#或者
[root@centos8 ~]#kill -9 1436
#再次观察,可以僵尸态的进程不存在了
[root@centos8 ~]#ps aux
=================================================
kill -18 启动
kill -9 强制杀死
kill -15 关闭(默认就是15)
~~~
![](D:\云计算\17.进程和计划任务\07.png)
### **ps** **输出属性**
~~~sh
C : ps -ef 显示列 C 表示cpu利用率
VSZ: Virtual memory SiZe,虚拟内存集,线性内存
RSS: ReSident Size, 常驻内存集
STAT:进程状态
R:running
S: interruptable sleeping
D: uninterruptable sleeping
T: stopped
Z: zombie
+: 前台进程, 无+就是后台执行
l: 多线程进程
L:内存分页并带锁
N:低优先级进程
<: 高优先级进程
s: session leader,会话(子进程)发起者
I:Idle kernel thread,CentOS 8 新特性
ni: nice值
pri: priority 优先级
rtprio: 实时优先级
psr: processor CPU编号
~~~
### **LRU** **算法**
LRU:Least Recently Used 近期最少使用算法(喜新厌旧),释放内存
假设序列为 4 3 4 2 3 1 4 2, 物理块有3个,则
第1轮 4调入内存 4
第2轮 3调入内存 3 4
第3轮 4调入内存 4 3
第4轮 2调入内存 2 4 3
第5轮 3调入内存 3 2 4
第6轮 1调入内存 1 3 2
第7轮 4调入内存 4 1 3
第8轮 2调入内存 2 4 1
**IPC** **进程间通信**
![](D:\云计算\17.进程和计划任务\09.png)
IPC: Inter Process Communication
* 同一主机:
~~~sh
pipe 管道,单向传输
socket 套接字文件
Memory-maped file 文件映射,将文件中的一段数据映射到物理内存,多个进程共享这片内存
shm shared memory 共享内存
signal 信号
Lock 对资源上锁,如果资源已被某进程锁住,则其它进程想修改甚至读取这些资源,都将被
阻塞,直到锁被打开
semaphore 信号量,一种计数器
~~~
* 不同主机
不同主机:socket=IP和端口号
~~~sh
RPC remote procedure call
MQ 消息队列,生产者和消费者,如:Kafka,RabbitMQ,ActiveMQ
~~~
![](D:\云计算\17.进程和计划任务\10.png)
**利用管道文件实现进IPC**
~~~sh
[root@centos8 ~]#mkfifo /data/test.fifo #创建一个管道文件
[root@centos8 ~]#ll /data/test.fifo
prw-r--r-- 1 root root 0 May 6 14:32 /data/test.fifo
[root@centos8 ~]#cat > /data/test.fifo
magedu
#在另一个终端可以从文件中读取数据
[root@centos8 ~]#cat /data/test.fifo
magedu
管道文件特点:一对一的,是单向的传输的
如果是普通文件是无法做到的
~~~
范例:查找socket文件
~~~sh
[root@centos8 ~]#find / -type s -ls
~~~
~~~sh
[root@centos7: ~]#ps aux
USER PID %CPU %MEM VSZ RSS TTY STAT START TIME COMMAND
VSZ 虚拟内存
RSS 实际内存
~~~
### **进程优先级**
进程优先级:
系统优先级:数字越小,优先级越高
0-139(CentOS 4,5),各有140个运行队列和过期队列
0-98,99(CentOS 6)
实时优先级: 99-0 值最大优先级最高
nice值:-20到19,对应系统优先级100-139或99
Big O:时间(空间)复杂度,用时(空间)和规模的关系
O(1), O(logn), O(n)线性, O(n^2)抛物线, O(2^n)
**进程分类**
**操作系统分类:**
协作式多任务:早期 windows 系统使用,即一个任务得到了 CPU 时间,除非它自己放弃使用
CPU ,否则将完全霸占 CPU ,所以任务之间需要协作——使用一段时间的 CPU ,主动放弃使用
抢占式多任务:Linux内核,CPU的总控制权在操作系统手中,操作系统会轮流询问每一个任务是
否需要使用 CPU ,需要使用的话就让它用,不过在一定时间后,操作系统会剥夺当前任务的 CPU
使用权,把它排在询问队列的最后,再去询问下一个任务
**进程类型:**
守护进程: daemon,在系统引导过程中启动的进程,和终端无关进程
前台进程:跟终端相关,通过终端启动的进程
注意:两者可相互转化
**按进程资源使用的分类:**
CPU-Bound:CPU密集型,非交互, 比如压缩解压缩
IO-Bound:IO密集型,交互 比如 web 服务器
**IO****调度算法**
在LINUX 2.6中,有四种关于IO的调度算法,下面综合小结一下:
~~~sh
NOOP
NOOP算法的全写为No Operation。该算法实现了最简单的FIFO队列,所有IO请求大致按照先来
后到的顺序进行操作。之所以说“大致”,原因是NOOP在FIFO的基础上还做了相邻IO请求的合并,
并不是完完全全按照先进先出的规则满足IO请求。NOOP假定I/O请求由驱动程序或者设备做了优
化或者重排了顺序(就像一个智能控制器完成的工作那样)。在有些SAN环境下,这个选择可能是最
好选择。Noop 对于 IO 不那么操心,对所有的 IO请求都用 FIFO 队列形式处理,默认认为 IO 不会
存在性能问题。这也使得 CPU 也不用那么操心。当然,对于复杂一点的应用类型,使用这个调度
器,用户自己就会非常操心。
Deadline scheduler
DEADLINE在CFQ的基础上,解决了IO请求饿死的极端情况。deadline 算法保证对于既定的 IO 请
求以最小的延迟时间,除了CFQ本身具有的IO排序队列之外,DEADLINE额外分别为读IO和写IO提
供了FIFO队列。读FIFO队列的最大等待时间为500ms,写FIFO队列的最大等待时间为5s。FIFO队
列内的IO请求优先级要比CFQ队列中的高,,而读FIFO队列的优先级又比写FIFO队列的优先级
高。优先级可以表示如下:
FIFO(Read) > FIFO(Write) > CFQ
Anticipatory scheduler
CFQ和DEADLINE考虑的焦点在于满足零散IO请求上。对于连续的IO请求,比如顺序读,并没有做
优化。为了满足随机IO和顺序IO混合的场景,Linux还支持ANTICIPATORY调度算法。
ANTICIPATORY的在DEADLINE的基础上,为每个读IO都设置了6ms 的等待时间窗口。如果在这
6ms内OS收到了相邻位置的读IO请求,就可以立即满足 Anticipatory scheduler(as) 曾经一度
是 Linux 2.6 Kernel 的 IO scheduler 。Anticipatory 的中文含义是”预料的, 预想的”, 这个词的确揭
示了这个算法的特点,简单的说,有个 IO 发生的时候,如果又有进程请求 IO 操作,则将产生一
个默认的 6 毫秒猜测时间,猜测下一个 进程请求 IO 是要干什么的。这对于随即读取会造成比较大
的延时,对数据库应用很糟糕,而对于 Web Server 等则会表现的不错。这个算法也可以简单理解
为面向低速磁盘的,因为那个”猜测”实际上的目的是为了减少磁头移动时间。
CFQ
CFQ算法的全写为Completely Fair Queuing。该算法的特点是按照IO请求的地址进行排序,而不
是按照先来后到的顺序来进行响应。 在传统的SAS盘上,磁盘寻道花去了绝大多数的IO响应时
间。CFQ的出发点是对IO地址进行排序,以尽量少的磁盘旋转次数来满足尽可能多的IO请求。在
CFQ算法下,SAS盘的吞吐量大大提高了。但是相比于NOOP的缺点是,先来的IO请求并不一定能
被满足,可能会出现饿死的情况。
Completely Fair Queuing (cfq, 完全公平队列) 在 2.6.18 取代了 Anticipatory scheduler 成为
Linux Kernel 默认的 IO scheduler 。cfq 对每个进程维护一个 IO 队列,各个进程发来的 IO 请求
会被 cfq 以轮循方式处理。也就是对每一个 IO 请求都是公平的。这使得 cfq 很适合离散读的应用
(eg: OLTP DB)
~~~
### 查看IO调度算法
~~~sh
[root@ubuntu1804 ~]#cat /sys/block/sda/queue/scheduler
noop deadline [cfq]
[root@centos8 ~]#cat /sys/block/sda/queue/scheduler
[mq-deadline] kyber bfq none
[root@centos7 ~]#cat /sys/block/sda/queue/scheduler
noop [deadline] cfq
[root@centos6 ~]#cat /sys/block/sda/queue/scheduler
noop anticipatory deadline [cfq]
~~~
### **进程管理和性能相关工具**
~~~sh
Linux系统状态的查看及管理工具:pstree, ps, pidof, pgrep, top, htop, glance, pmap, vmstat, dstat,
kill, pkill, job, bg, fg, nohup
~~~
#### **进程树** **pstree**
pstree 可以用来显示进程的父子关系,以树形结构显示
~~~sh
pstree [OPTION] [ PID | USER ]
~~~
~~~sh
-p 显示PID
-T 不显示线程thread,默认显示线程
-u 显示用户切换
-H pid 高度指定进程及其前辈进程
~~~
#### 高亮显示前辈进程
~~~sh
[root@centos8 ~]#pstree -pH 1780
~~~
![](D:\云计算\17.进程和计划任务\11.png)
#### **进程信息** **ps**
ps 即process state,可以进程当前状态的快照,默认显示当前终端中的进程,Linux系统各进程的相关
信息均保存在/proc/PID目录下的各文件中
支持三种选项:
UNIX选项 如: -A -e
BSD选项 如: a
GNU选项 如: --help
~~~sh
#加不加- 的效果不一样
[root@centos7: ~]#ps a
PID TTY STAT TIME COMMAND
679 tty1 Ss+ 0:00 /sbin/agetty --noclear tty1 linux
1037 pts/0 Ss 0:00 -bash
1761 pts/1 Ss 0:00 -bash
2300 pts/1 S 0:00 su - wang
2301 pts/1 S+ 0:00 -bash
2364 pts/0 S+ 0:00 sleep 36
2368 pts/2 Ss 0:00 -bash
2389 pts/2 R+ 0:00 ps a
[root@centos7: ~]#ps -a
PID TTY TIME CMD
2300 pts/1 00:00:00 su
2301 pts/1 00:00:00 bash
2390 pts/2 00:00:00 ps
~~~
![](D:\云计算\17.进程和计划任务\12.png)
![](D:\云计算\17.进程和计划任务\13.png)
![](D:\云计算\17.进程和计划任务\29.png)
![](D:\云计算\17.进程和计划任务\14.png)
~~~sh
a 选项包括所有终端中的进程
x 选项包括不链接终端的进程
u 选项显示进程所有者的信息
f 选项显示进程树,显示进程之间的父子关系,不用pstree,相当于 --forest
k|--sort 属性 对属性排序,属性前加 - 表示倒序
o 调哪些字段来排序,属性… 选项显示定制的信息 pid、cmd、%cpu、%mem
L 显示支持的属性列表
-C cmdlist 指定命令,多个命令用,分隔
-L 显示线程
-e 显示所有进程,相当于-A
-f 显示完整格式程序信息
-F 显示更完整格式的进程信息
-H 以进程层级格式显示进程相关信息
-u userlist 指定有效的用户ID或名称
-U userlist 指定真正的用户ID或名称
-g gid或groupname 指定有效的gid或组名称
-G gid或groupname 指定真正的gid或组名称
-p pid 显示指pid的进程
--ppid pid 显示属于pid的子进程
-t ttylist 指定tty,相当于 t
-M 显示SELinux信息,相当于Z
~~~
#### **ps** **输出属性**
~~~sh
C : ps -ef 显示列 C 表示cpu利用率
VSZ: Virtual memory SiZe,虚拟内存集,线性内存
RSS: ReSident Size, 常驻内存集
STAT:进程状态
R:running
S: interruptable sleeping
D: uninterruptable sleeping
T: stopped
Z: zombie
+: 前台进程
l: 多线程进程
L:内存分页并带锁
N:低优先级进程
<: 高优先级进程
s: session leader,会话(子进程)发起者
I:Idle kernel thread,CentOS 8 新特性
ni: nice值
pri: priority 优先级
rtprio: 实时优先级
psr: processor CPU编号
# ps axo pid,cmd,psr,ni,pri,rtprio
~~~
#### **常用组合:**
~~~sh
aux
-ef
-eFH
-eo pid,tid,class,rtprio,ni,pri,psr,pcpu,stat,comm
axo stat,euid,ruid,tty,tpgid,sess,pgrp,ppid,pid,pcpu,comm
~~~
### 查看进程的特定属性
~~~sh
-o 挑出特定的字段来显示
[root@centos8 ~]#ps axo pid,cmd,%mem,%cpu
PID CMD %MEM %CPU
1 /usr/lib/systemd/systemd -- 1.2 0.0
2 [kthreadd] 0.0 0.0
3 [rcu_gp] 0.0 0.0
4 [rcu_par_gp] 0.0 0.0
6 [kworker/0:0H-kblockd] 0.0 0.0
7 [kworker/u256:0-events_unbo 0.0 0.0
8 [mm_percpu_wq] 0.0 0.0
9 [ksoftirqd/0] 0.0 0.0
~~~
### 按CPU利用率和内存倒序排序加 -
~~~sh
[root@centos8 ~]#ps axo pid,cmd,%cpu,%mem k -%cpu #该参数排序centos6不支持
PID CMD %CPU %MEM
1907 dd if=/dev/zero of=/dev/nul 94.5 0.0
1914 ping 127.0.1 -f 66.0 0.2
1915 [kworker/u256:2-events_unbo 0.7 0.0
1 /usr/lib/systemd/systemd -- 0.0 1.2
2 [kthreadd] 0.0 0.0
3 [rcu_gp] 0.0 0.0
4 [rcu_par_gp] 0.0 0.0
#按内存倒序排序
[root@centos8 ~]#ps axo pid,cmd,%cpu,%mem --sort -%mem
PID CMD %CPU %MEM #该参数排序centos6不支持
772 /usr/libexec/sssd/sssd_nss 0.0 4.5
733 /usr/libexec/platform-pytho 0.0 4.0
670 /usr/lib/polkit-1/polkitd - 0.0 2.9
665 /usr/sbin/NetworkManager -- 0.0 2.1
668 /usr/bin/vmtoolsd 0.0 1.8
753 /usr/libexec/sssd/sssd_be - 0.0 1.7
663 /usr/sbin/sssd -i --logger= 0.0 1.6
667 /usr/bin/VGAuthService -s 0.0 1.5
1 /usr/lib/systemd/systemd -- 0.0 1.2
~~~
### 范例:有效用户和实际用户
~~~sh
[wang@centos8 ~]$passwd
Changing password for user wang.
Current password:
[root@centos8 ~]#ps axo pid,cmd,%cpu,%mem,user,euser,ruser | grep passwd
1965 passwd 0.0 1.0 root root wang #wang用户执行passwd的时候,有效用户是wang真正的用户是root。
1970 grep --color=auto passwd 0.0 0.1 root root root
[root08:20 AMcentos8 ~]#ll `which passwd`
-rwsr-xr-x. 1 root root 33600 Apr 7 2020 /usr/bin/passwd
~~~
### **查看进程信息****prtstat**
可以显示进程信息,来自于psmisc包
prtstat [options] PID ....
![](D:\云计算\17.进程和计划任务\15.png)
~~~sh
-r raw 格式显示
[root@centos8 ~]#prtstat 18395
Process: httpd State: S (sleeping)
CPU#: 1 TTY: 0:0 Threads: 65
Process, Group and Session IDs
Process ID: 18395 Parent ID: 18386
Group ID: 18386 Session ID: 18386
T Group ID: -1
Page Faults
This Process (minor major): 509 0
Child Processes (minor major): 0 0
CPU Times
This Process (user system guest blkio): 0.03 0.47 0.00 0.00
Child processes (user system guest): 0.00 0.00 0.00
Memory
Vsize: 2651 MB
RSS: 15 MB RSS Limit: 18446744073709 MB
Code Start: 0x5575c5525000 Code Stop: 0x5575c55aace0
Stack Start: 0x7ffc6b353ab0
Stack Pointer (ESP): 0 Inst Pointer (EIP): 0
Scheduling
Policy: normal
Nice: 0 RT Priority: 0 (non RT)
[root@centos8 ~]#prtstat -r 18395
pid: 18395 comm: httpd
state: S ppid: 18386
pgrp: 18386 session: 18386
tty_nr: 0 tpgid: -1
flags: 400140 minflt: 509
cminflt: 0 majflt: 0
cmajflt: 0 utime: 3
stime: 47 cutime: 0
cstime: 0 priority: 20
nice: 0 num_threads: 65
itrealvalue: 0 starttime: 8709457
vsize: 2651152384 rss: 3900
rsslim: 18446744073709551615 startcode: 93964310040576
endcode: 93964310588640 startstack: 140722107136688
kstkesp: 0 kstkeip: 0
wchan: 0 nswap: 0
cnswap: 0 exit_signal: 17
processor: 1 rt_priority: 0
policy: 0 delayaccr_blkio_ticks: 0
guest_time: 0 cguest_time: 0
~~~
### nice**设置和 renice调整进程优先级**
进程优先级调整
静态优先级:100-139
进程默认启动时的nice值为0,优先级为120
只有根用户才能降低nice值(提高优先性)
nice命令
以指定的优先级来启动进程
~~~sh
nice [OPTION] [COMMAND [ARG]...]
-n, --adjustment=N add integer N to the niceness (default 10)
# 例如 用10优先级来运行ping
[root08:34 AMcentos8 ~]#nice -n -10 ping 127.0.0.1
[root08:33 AMcentos8 ~]#ps axo pid,cmd,nice |grep ping |grep -v color
1886 ping 127.0.0.1 -10
# renice命令调整正在运行的进程的优先级
第一步:运行进程
[root08:40 AMcentos8 ~]#nice -n -10 ping 127.0.0.1
第二部:查询进程的PID号
[root08:39 AMcentos8 ~]#ps axo pid,cmd |grep ping
1909 ping 127.0.0.1
1942 grep --color=auto ping
第三步:修改进程的PID
[root08:39 AMcentos8 ~]#renice -n -29 1909
1909 (process ID) old priority -10, new priority -20
#优先级的修改不能超过[-20,19] ,值越大,优先级就低。人越好,优先级就越差
~~~
![](D:\云计算\17.进程和计划任务\16.png)
### pri优先级[39-0],数字越大,优先级越高
~~~sh
[root08:52 AMcentos8 ~]#ps axo pid,cmd,ni,pri |grep ping
1966 ping 127.0.0.1 -20 39 #pri的39对于 -20
1974 grep --color=auto ping 0 19
~~~
![](D:\云计算\17.进程和计划任务\17.png)
### nice的特殊写法
~~~sh
[root08:52 AMcentos8 ~]#nice -19 dd if=/dev/zero of=/dev/null 代表19
[root08:52 AMcentos8 ~]#nice --19 dd if=/dev/zero of=/dev/null 代表-19
~~~
### 属性: psr 查看进程运行在那颗CPU上
CPU的三级缓存被共享
~~~sh
[root09:03 AMcentos8 ~]#ps axo pid,cmd,ni,pri,psr |grep ping
2068 ping 127.0.0.1 -20 39 0
2081 grep --color=auto ping 0 19 0
#绑定一个进程在CPU上
~~~
### 绑定CPU,实现进程和CPU的绑定
~~~sh
[root09:03 AMcentos8 ~]#taskset --help
Usage: taskset [options] [mask | cpu-list] [pid|cmd [args...]]
~~~
### 属性:rtprio(实时优先级)
![](D:\云计算\17.进程和计划任务\18.png)
~~~sh
[root09:10 AMcentos8 ~]#ps axo pid,cmd,psr,ni,pri,rtprio
~~~
### 修改缓存,不建议需修改
~~~sh
[root04:37 PMcentos7 ]#echo 3 > /proc/sys/vm/drop_caches
[root04:37 PMcentos7 ]#cat /proc/sys/vm/drop_caches
3
[root04:37 PMcentos7 ]#echo 0 > /proc/sys/vm/drop_caches
bash: echo: write error: Invalid argument
~~~
### **搜索进程**
按条件搜索进程
ps 选项 | grep 'pattern' 灵活
pgrep 按预定义的模式
/sbin/pidof 按确切的程序名称查看pid
pgrep 命令格式
~~~sh
-u uid: effective user,生效者
-U uid: real user,真正发起运行命令者
-t terminal: 与指定终端相关的进程
[root09:22 AMcentos8 ~]#pgrep -at pts/2
1916 -bash
2114 su - wang
2115 -bash
2143 ping 127.0.0.1
-l: 显示进程名
-a: 显示完整格式的进程名
-P pid: 显示指定进程的子进程
[root@centos8 ~]#pgrep -aP 2303
2330 dd if=/dev/zero of=/dev/null
~~~
~~~sh
[root@centos8 ~]#pgrep -u wang #查看wang 用户运行的进程
2303
2330
[root@centos8 ~]#pgrep -lu wang #查看wang发起的进程在做啥?
2303 bash
2330 dd
#错误写法
[root@centos8 ~]#pgrep -ul wang
pgrep: invalid user name: l
[root@centos8 ~]#pgrep -au wang
2303 -bash
2330 dd if=/dev/zero of=/dev/null
[root@centos8 ~]#pgrep -aP 2303
2330 dd if=/dev/zero of=/dev/null
[root@centos8 ~]#pgrep -at pts/2
1482 -bash
2302 su - wang
2303 -bash
2330 dd if=/dev/zero of=/dev/null
~~~
### pidof 格式
~~~sh
pidof [options] [program [...]]
-x 按脚本名称查找pid,不加脚本就是二进制程序
[root@centos8 ~]#pidof bash
19035 18813 18789 1251
[root@centos8 ~]#pidof ping.sh
[root@centos8 ~]#pidof -x ping.sh
19035
~~~
### **负载查询** **uptime**
~~~sh
/proc/uptime 包括两个值,单位 s
[root09:33 AMcentos8 ~]#cat /proc/uptime
9394.30 8717.55
~~~
系统启动时长
空闲进程的总时长(按总的CPU核数计算)
uptime 和 w 显示以下内容
* 当前时间
* 系统已启动的时间
* 当前上线人数
* 系统平均负载(1、5、15分钟的平均负载,一般不会超过1,超过5时建议警报)
系统平均负载: 指在特定时间间隔内运行队列中的平均进程数,通常每个CPU内核的当前活动进程数不大
于3,那么系统的性能良好。如果每个CPU内核的任务数大于5,那么此主机的性能有严重问题
如:linux主机是1个双核CPU,当Load Average 为6的时候说明机器已经被充分使用
范例:
~~~sh
[root@centos8 ~]#uptime
09:38:34 up 1 day, 1:04, 2 users, load average: 0.00, 0.00, 0.00
[root@centos8 ~]#w
09:38:29 up 1 day, 1:04, 2 users, load average: 0.00, 0.00, 0.00
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
root pts/0 10.0.0.1 Wed08 0.00s 0.32s 0.00s w
root pts/1 10.0.0.1 09:10 5:25 0.06s 0.00s /bin/bash
./ping.sh
例如:不停的dd 导致CPU繁忙
[root09:33 AMcentos8 ~]#uptime
09:33:18 up 2:34, 4 users, load average: 2.00, 0.63, 0.22
~~~
![](D:\云计算\17.进程和计划任务\19.png)
![](D:\云计算\17.进程和计划任务\20.png)
### mpstat显示CPU相关统计
~~~sh
yum install -y sysstat
[root@centos7: ~]#mpstat
Linux 3.10.0-1160.25.1.el7.x86_64 (centos7) 05/19/2021 _x86_64_ (2 CPU)
09:40:14 AM CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle
09:40:14 AM all 2.15 0.00 4.70 0.82 0.00 0.25 0.00 0.00 0.00 92.07
[root@centos8 ~]#mpstat 1 3 # 1秒执行一次,执行三次
%steal :偷 被虚拟程序占用的CPU,被盗取的CPU时间片段
[root03:28 PMcentos7 ]#mpstat -P 0 显示第一个CPU信息
Linux 3.10.0-1160.25.1.el7.x86_64 (centos7) 05/07/2021 _x86_64_ (2 CPU)
03:29:07 PM CPU %usr %nice %sys %iowait %irq %soft %steal %guest %gnice %idle
03:29:07 PM 0 0.02 0.00 0.14 0.01 0.00 0.00 0.00 0.00 0.00 99.82
~~~
**%steal :偷 被虚拟程序占用的CPU,被盗取的CPU时间片段**
### **查看进程实时状态** **top**
~~~sh
[root@centos7: ~]#top
top - 09:46:22 up 7 min, 1 user, load average: 0.00, 0.01, 0.01
Tasks: 104 total, 1 running, 103 sleeping, 0 stopped, 0 zombie
%Cpu(s): 0.0 us, 0.2 sy, 0.0 ni, 99.8 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
KiB Mem : 995692 total, 632780 free, 193616 used, 169296 buff/cache
KiB Swap: 8388604 total, 8388604 free, 0 used. 656872 avail Mem
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
1 root 20 0 125340 3856 2576 S 0.0 0.4 0:00.92 systemd
2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd
4 root 0 -20 0 0 0 S 0.0 0.0 0:00.00 kworker/0:0H
5 root 20 0 0 0 0 S 0.0 0.0 0:00.01 kworker/u256:0
6 root 20 0 0 0 0 S 0.0 0.0 0:00.05 ksoftirqd/0 #默认让CPU的优先级排序
~~~
top 提供动态的实时进程状态
有许多内置命令
帮助:h 或 ? ,按 q 或esc 退出帮助
排序:
P:以占据的CPU百分比,%CPU
M:占据内存百分比,%MEM
T:累积占据CPU时长,TIME+
首部信息显示:
uptime信息:l命令
tasks及cpu信息:t命令
cpu分别显示:1 (数字)
memory信息:m命令
退出命令:q
修改刷新时间间隔:s
终止指定进程:k
保存文件:Wtop命令栏位信息简介
us:用户空间
sy:内核空间
ni:调整nice时间
id:空闲
wa:等待IO时间
hi:硬中断
si:软中断(模式切换)
st:虚拟机偷走的时间
* top选项:
-d # 指定刷新时间间隔,默认为3秒
-b 全部显示所有进程
-n # 刷新多少次后退出
-H 线程模式
~~~sh
top选项:
-d # 指定刷新时间间隔,默认为3秒
-b 全部显示所有进程
-n # 刷新多少次后退出
-H 线程模式
示例:
top -H -p `pidof mysqld`
#htop命令:增强版的TOP命令,来自EPEL源,比top功能更强
选项:
-d #: 指定延迟时间;
-u UserName: 仅显示指定用户的进程
-s COLUME: 以指定字段进行排序
子命令:
s:跟踪选定进程的系统调用
l:显示选定进程打开的文件列表
a:将选定的进程绑定至某指定CPU核心
t:显示进程树
~~~
### htop命令:增强版的TOP命令,来自EPEL源,比top功能更强
~~~sh
选项:
-d #: 指定延迟时间;
-u UserName: 仅显示指定用户的进程
-s COLUME: 以指定字段进行排序
子命令:
s:跟踪选定进程的系统调用
l:显示选定进程打开的文件列表
a:将选定的进程绑定至某指定CPU核心
t:显示进程树
~~~
### **free** **内存空间**
![](D:\云计算\17.进程和计划任务\21.png)
~~~sh
-b 以字节为单位
-m 以MB为单位
-g 以GB为单位
-h 易读格式
-o 不显示-/+buffers/cache行
-t 显示RAM + swap的总和
-s n 刷新间隔为n秒
-c n 刷新n次后即退出
~~~
~~~sh
[root@centos8 ~]#free -h
total used free shared buff/cache available
Mem: 1.8Gi 355Mi 724Mi 9.0Mi 726Mi 1.2Gi
Swap: 2.0Gi 0B 2.0Gi
[root@centos8 ~]#echo 3 > /proc/sys/vm/drop_caches #清除缓冲区的内存,不建议清理
[root@centos8 ~]#free -h
total used free shared buff/cache available
Mem: 1.8Gi 320Mi 1.3Gi 9.0Mi 152Mi 1.3Gi
Swap: 2.0Gi 0B 2.0Gi
~~~
### **进程对应的内存映射****pmap**
pmap [options] pid [...]
-x: 显示详细格式的信息
cat /proc/PID/maps
~~~sh
[root@centos8 ~]#pmap 33477
33477: ping 127.0.0.1
000055f708aa7000 56K r-x-- ping
000055f708cb5000 4K r---- ping
000055f708cb6000 4K rw--- ping
000055f708cb7000 140K rw--- [ anon ]
000055f70a7cc000 132K rw--- [ anon ]
00007fe73fb13000 2528K r---- LC_COLLATE
00007fe73fd8b000 108K r-x-- libpthread-2.28.so
00007fe73fda6000 2044K ----- libpthread-2.28.so
00007fe73ffa5000 4K r---- libpthread-2.28.so
00007fe73ffa6000 4K rw--- libpthread-2.28.so
00007fe73ffa7000 16K rw--- [ anon ]
00007fe73ffab000 12K r-x-- libdl-2.28.so
00007fe73ffae000 2044K ----- libdl-2.28.so
00007fe7401ad000 4K r---- libdl-2.28.so
00007fe7401ae000 4K rw--- libdl-2.28.so
00007fe7401af000 88K r-x-- libz.so.1.2.11
00007fe7401c5000 2044K ----- libz.so.1.2.11
#查看系统调用
[root@centos7 ~]#dnf -y install strace
[root@centos7 ~]#strace ls 跟踪进程的执行
execve("/usr/bin/ls", ["ls"], 0x7ffd4b9dad50 /* 25 vars */) = 0
brk(NULL) = 0x55ed4c7d7000
arch_prctl(0x3001 /* ARCH_??? */, 0x7ffd500ae390) = -1 EINVAL (Invalid argument)
access("/etc/ld.so.preload", R_OK) = -1 ENOENT (No such file or directory)
openat(AT_FDCWD, "/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 3
fstat(3, {st_mode=S_IFREG|0644, st_size=73944, ...}) = 0
mmap(NULL, 73944, PROT_READ, MAP_PRIVATE, 3, 0) = 0x7fce5dfa7000
close(3) = 0
#查看库调用 语言库
[root@centos7 ~]#yum -y install ltrace
[root@centos7 ~]# ltrace ls
__libc_start_main(0x402910, 1, 0x7ffcca28b1b8, 0x4129a0
strrchr("ls", '/')
= nil
setlocale(LC_ALL, "")
= "en_US.utf8"
bindtextdomain("coreutils", "/usr/share/locale")
= "/usr/share/locale"
textdomain("coreutils")
~~~
### **虚拟内存信息****vmstat**
vmstat [options] [delay [count]]
~~~sh
procs:
r:可运行(正运行或等待运行)进程的个数,和核心数有关
b:处于不可中断睡眠态的进程个数(被阻塞的队列的长度)
memory:
swpd: 交换内存的使用总量
free:空闲物理内存总量
buffer:用于buffer的内存总量
cache:用于cache的内存总量
swap:
si:从磁盘交换进内存的数据速率(kb/s)
so:从内存交换至磁盘的数据速率(kb/s)
io:
bi:从块设备读入数据到系统的速率(kb/s)
bo: 保存数据至块设备的速率
system:
in: interrupts 中断速率,包括时钟
cs: context switch 进程切换速率
cpu:
us:Time spent running non-kernel code
sy: Time spent running kernel code
id: Time spent idle. Linux 2.5.41前,包括IO-wait time.
wa: Time spent waiting for IO. 2.5.41前,包括in idle.
st: Time stolen from a virtual machine. 2.6.11前, unknown.
~~~
-s: 显示内存的统计数据
~~~sh
[root@centos8 ~]#vmstat
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
1 0 0 1125284 5308 404636 0 0 1 1 25 33 0 0 100 0 0
[root@centos8 ~]#vmstat 1 3
procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
r b swpd free buff cache si so bi bo in cs us sy id wa st
0 0 0 1125408 5308 404676 0 0 1 1 25 33 0 0 100 0 00 0 0 1125248 5308 404676 0 0 0 0 165 236 0 0 100 0 0
0 0 0 1125188 5308 404676 0 0 0 0 146 216 0 0 100 0 0
[root@centos8 ~]#vmstat -s
1849460 K total memory
314348 K used memory
264424 K active memory
192500 K inactive memory
1125128 K free memory
5308 K buffer memory
404676 K swap cache
2097148 K total swap
0 K used swap
2097148 K free swap
2519 non-nice user cpu ticks
1027 nice user cpu ticks
10178 system cpu ticks
36616214 idle cpu ticks
294 IO-wait cpu ticks
5043 IRQ cpu ticks
5150 softirq cpu ticks
0 stolen cpu ticks
249439 pages paged in
301109 pages paged out
0 pages swapped in
0 pages swapped out
9338473 interrupts
12059933 CPU context switches
1578443646 boot time
19386 forks
~~~
### 统计CPU和设备IO信息iostat
此工具由sysstat包提供
~~~sh
[root@centos8 ~]#iostat
Linux 4.18.0-80.el8.x86_64 (centos8.localdomain) 01/09/2020 _x86_64_ (4
CPU)
avg-cpu: %user %nice %system %iowait %steal %idle
0.01 0.00 0.06 0.00 0.00 99.93
Device tps kB_read/s kB_wrtn/s kB_read kB_wrtn
sda 0.31 2.57 3.52 238227 326708
scd0 0.01 0.14 0.00 13140 0
[root@centos8 ~]#iostat 1 3
Linux 4.18.0-80.el8.x86_64 (centos8.localdomain) 01/09/2020 _x86_64_ (4
CPU)
avg-cpu: %user %nice %system %iowait %steal %idle
0.01 0.00 0.06 0.00 0.00 99.93
Device tps kB_read/s kB_wrtn/s kB_read kB_wrtn
sda 0.31 2.57 3.52 238227 326708
scd0 0.01 0.14 0.00 13140 0
avg-cpu: %user %nice %system %iowait %steal %idle
0.00 0.00 0.25 0.00 0.00 99.75
Device tps kB_read/s kB_wrtn/s kB_read kB_wrtn
sda 0.00 0.00 0.00 0 0
scd0 0.00 0.00 0.00 0 0
avg-cpu: %user %nice %system %iowait %steal %idle
0.00 0.00 0.00 0.00 0.00 100.00
Device tps kB_read/s kB_wrtn/s kB_read kB_wrtn
sda 0.00 0.00 0.00 0 0
scd0 0.00 0.00 0.00 0 0
~~~
### **系统资源统计** **dstat**
![](D:\云计算\17.进程和计划任务\22.png)
dstat由pcp-system-tools包提供,用于代替 vmstat,iostat功能
格式:
~~~sh
dstat [-afv] [options..] [delay [count]]
~~~
~~~sh
-c 显示cpu相关信息
-C #,#,...,total
-d 显示disk相关信息
-D total,sda,sdb,...
-g 显示page相关统计数据
-m 显示memory相关统计数据
-n 显示network相关统计数据
-p 显示process相关统计数据
-r 显示io请求相关的统计数据
-s 显示swapped相关的统计数据
--tcp
--udp
--unix
--raw
--socket
--ipc
--top-cpu:显示最占用CPU的进程
--top-io: 显示最占用io的进程
--top-mem: 显示最占用内存的进程
--top-latency: 显示延迟最大的进程
~~~
~~~sh
[root@centos8 ~]#dstat 1 6
You did not select any stats, using -cdngy by default.
----total-usage---- -dsk/total- -net/total- ---paging-- ---system--
usr sys idl wai stl| read writ| recv send| in out | int csw
0 0 99 0 0| 0 2687k| 64 601 | 0 0 | 256 164
0 0 100 0 0| 0 0 | 64 330 | 0 0 | 121 155
0 0 100 0 0| 0 0 | 64 330 | 0 0 | 104 144
0 0 100 0 0| 0 0 | 64 330 | 0 0 | 110 145
0 0 99 0 0| 0 0 | 64 330 | 0 0 | 100 130
~~~
### **监视磁盘****I/O iotop**
![](D:\云计算\17.进程和计划任务\23.png)
~~~sh
iotop命令是一个用来监视磁盘I/O使用状况的top类工具iotop具有与top相似的UI,其中包括PID、用
户、I/O、进程等相关信息,可查看每个进程是如何使用IO
iotop输出
第一行:Read和Write速率总计
第二行:实际的Read和Write速率
第三行:参数如下:
线程ID(按p切换为进程ID)
优先级
用户
磁盘读速率
磁盘写速率
swap交换百分比
IO等待所占的百分比
iotop常用参数
-o, --only只显示正在产生I/O的进程或线程,除了传参,可以在运行过程中按o生效
-b, --batch非交互模式,一般用来记录日志
-n NUM, --iter=NUM设置监测的次数,默认无限。在非交互模式下很有用
-d SEC, --delay=SEC设置每次监测的间隔,默认1秒,接受非整形数据例如1.1
-p PID, --pid=PID指定监测的进程/线程
-u USER, --user=USER指定监测某个用户产生的I/O
-P, --processes仅显示进程,默认iotop显示所有线程
-a, --accumulated显示累积的I/O,而不是带宽
-k, --kilobytes使用kB单位,而不是对人友好的单位。在非交互模式下,脚本编程有用
iotop常用参数和快捷键
-t, --time 加上时间戳,非交互非模式
-q, --quiet 禁止头几行,非交互模式,有三种指定方式
-q 只在第一次监测时显示列名
-qq 永远不显示列名
-qqq 永远不显示I/O汇总
交互按键
left和right方向键:改变排序
r:反向排序
o:切换至选项--only
p:切换至--processes选项
a:切换至--accumulated选项
q:退出
i:改变线程的优先级
~~~
### **显示网络带宽使用情况iftop
![](D:\云计算\17.进程和计划任务\25.png)
~~~sh
通过EPEL源安装
iftop -n 以数字,不做名词解析
可以查看是哪个主机在消耗带宽,比如那台主机不断的消耗服务器带宽
root05:40 PMcentos7 ]#yum install iftop -y
iftop -n 不解析,以数字的方式来
[root05:46 PMcentos8 ~]#iptables -A INPUT -s 10.0.0.133 -j REJECT #直接拒绝
[root05:47 PMcentos8 ~]#iptables -F
[root05:50 PMcentos8 ~]#iptables -A INPUT -s 10.0.0.133 -j DROP #不响应
[root05:50 PMcentos8 ~]#iptables -F
[root05:51 PMcentosj DROP
[root07:16 PMcentos8 ~]#lsof -i :22
-a:列出打开文件存在的进程
-c<进程名>:列出指定进程所打开的文件
-g:列出GID号进程详情
-d<文件号>:列出占用该文件号的进程
+d<目录>:列出目录下被打开的文件
+D<目录>:递归列出目录下被打开的文件
-n<目录>:列出使用NFS的文件
-i<条件>:列出符合条件的进程(4、6、协议、:端口、 @ip )
-p<进程号>:列出指定进程号所打开的文件
-u:列出UID号进程详情
-h:显示帮助信息
-v:显示版本信息。
-n: 不反向解析网络名字
#查看一个文件正在被那个所占用
例如:
[root07:22 PMcentos8 ~]#lsof anaconda-ks.cfg
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
tail 1463 root 3r REG 8,2 1604 201326724 anaconda-ks.cfg
#删除一个被占用的文件找回
[root07:23 PMcentos8 ~]#lsof anaconda-ks.cfg
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
tail 1463 root 3r REG 8,2 1604 201326724 anaconda-ks.cfg
[root07:24 PMcentos8 ~]#rm -rf anaconda-ks.cfg
[root07:24 PMcentos8 ~]#
找到文件的所在进程
[root07:24 PMcentos8 ~]#lsof |grep delete
tail 1463 root 3r REG 8,2 1604 201326724 /root/anaconda-ks.cfg (deleted)
[root07:25 PMcentos8 ~]#ll /proc/`pidof tail`/fd
total 0
lrwx------ 1 root root 64 May 7 19:23 0 -> /dev/pts/0
lrwx------ 1 root root 64 May 7 19:23 1 -> /dev/pts/0
lrwx------ 1 root root 64 May 7 19:23 2 -> /dev/pts/0
lr-x------ 1 root root 64 May 7 19:23 3 -> '/root/anaconda-ks.cfg (deleted)'
lr-x------ 1 root root 64 May 7 19:23 4 -> anon_inode:inotify
#找回文件
[root07:28 PMcentos8 ~]#cat /proc/`pidof tail`/fd/3 > anaconda-ks.cfg
~~~
### **查看网络实时吞吐量****nload**
nload 是一个实时监控网络流量和带宽使用情况,以数值和动态图展示进出的流量情况,通过EPEL源安
装
界面操作
上下方向键、左右方向键、enter键或者tab键都就可以切换查看多个网卡的流量情况
按 F2 显示选项窗口
按 q 或者 Ctrl+C 退出 nload
~~~sh
#默认只查看第一个网络的流量进出情况
nload
#在nload后面指定网卡,可以指定多个,按左右键分别显示网卡状态
nload eth0 eth1
#设置刷新间隔:默认刷新间隔是100毫秒,可通过 -t 命令设置刷新时间(单位是毫秒)
nload -t 500 eth0
#设置单位:显示两种单位一种是显示Bit/s、一种是显示Byte/s,默认是以Bit/s,也可不显示/s
#-u h|b|k|m|g|H|B|K|M|G 表示的含义: h: auto, b: Bit/s, k: kBit/s, m: MBit/s, H:
auto, B: Byte/s, K: kByte/s, M: MByte/s
nload -u M eth0
~~~
### 远程 监控工具glances
~~~sh
yum 安装。配置epel源
#开启服务端
[root11:26 AMcentos7 ~]#glances -s
Glances server is running on 0.0.0.0:61209
#客服端连接
[root11:29 AMcentos7 ~]#glances -c 10.0.0.73
q 退出
~~~
![](D:\云计算\17.进程和计划任务\24.png)
~~~sh
此工具可以通过EPEL源安装,CentOS 8 目前没有提供
glances [-bdehmnrsvyz1] [-B bind] [-c server] [-C conffile] [-p port] [-P
password] [--password] [-t refresh] [-f file] [-o output]
内建命令:
a Sort processes automatically l Show/hide logs
c Sort processes by CPU% b Bytes or bits for network I/O
m Sort processes by MEM% w Delete warning logs
p Sort processes by name x Delete warning and critical logs
i Sort processes by I/O rate 1 Global CPU or per-CPU stats
d Show/hide disk I/O stats h Show/hide this help screen
f Show/hide file system stats t View network I/O as combination
n Show/hide network stats u View cumulative network I/O
s Show/hide sensors stats q Quit (Esc and Ctrl-C also work)
y Show/hide hddtemp stats
-b: 以Byte为单位显示网卡数据速率
-d: 关闭磁盘I/O模块
-f /path/to/somefile: 设定输入文件位置
-o {HTML|CSV}:输出格式
-m: 禁用mount模块
-n: 禁用网络模块
-t #: 延迟时间间隔
-1:每个CPU的相关数据单独显示
C/S模式下运行glances命令
服务器模式:
glances -s -B IPADDR
IPADDR: 指明监听的本机哪个地址
客户端模式:
glances -c IPADDR
IPADDR:要连入的服务器端地址
~~~
### **查看进程打开文件** **lsof**
![](D:\云计算\17.进程和计划任务\26.png)
lsof:list open fifiles,查看当前系统文件的工具。在linux环境下,一切皆文件,用户通过文件不仅可以
访问常规数据,还可以访问网络连接和硬件如传输控制协议 (TCP) 和用户数据报协议 (UDP)套接字等,
系统在后台都为该应用程序分配了一个文件描述符
命令选项
~~~sh
-a:列出打开文件存在的进程
-c<进程名>:列出指定进程所打开的文件
-g:列出GID号进程详情
-d<文件号>:列出占用该文件号的进程
+d<目录>:列出目录下被打开的文件
+D<目录>:递归列出目录下被打开的文件
-n<目录>:列出使用NFS的文件
-i<条件>:列出符合条件的进程(4、6、协议、:端口、 @ip )
-p<进程号>:列出指定进程号所打开的文件
-u:列出UID号进程详情
-h:显示帮助信息
-v:显示版本信息。
-n: 不反向解析网络名字
~~~
# 面试题:跟踪谁在使用一个文件
~~~sh
[root11:38 AMcentos7 ~]#lsof anaconda-ks.cfg
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
tail 2915 root 3r REG 253,0 1248 269457919 anaconda-ks.cfg
~~~
![](D:\云计算\17.进程和计划任务\27.png)
~~~sh
#查看由登陆用户启动而非系统启动的进程
lsof /dev/pts/1
#指定进程号,可以查看该进程打开的文件
lsof -p 9527
[root@centos8 ~]#lsof -p `pidof bc`
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
bc 1929 root cwd DIR 8,2 286 201326721 /root
bc 1929 root rtd DIR 8,2 4096 128 /
bc 1929 root txt REG 8,2 97256 201784353 /usr/bin/bc
bc 1929 root mem REG 8,2 28784 171116 /usr/lib64/libdl-2.28.so
bc 1929 root mem REG 8,2 3201344 171114 /usr/lib64/libc-2.28.so
bc 1929 root mem REG 8,2 208616 171019
/usr/lib64/libtinfo.so.6.1
bc 1929 root mem REG 8,2 216912 171009
/usr/lib64/libncurses.so.6.1
bc 1929 root mem REG 8,2 338648 232638
/usr/lib64/libreadline.so.7.0
bc 1929 root mem REG 8,2 243520 171107 /usr/lib64/ld-2.28.so
bc 1929 root mem REG 8,2 337024 134631849
/usr/lib/locale/en_US.utf8/LC_CTYPE
bc 1929 root mem REG 8,2 26398 67337760 /usr/lib64/gconv/gconv-
modules.cache
bc 1929 root 0u CHR 136,0 0t0 3 /dev/pts/0
bc 1929 root 1u CHR 136,0 0t0 3 /dev/pts/0
bc 1929 root 2u CHR 136,0 0t0 3 /dev/pts/0
~~~
### 范例:利用 lsof 恢复正在使用中的误删除的文件
~~~sh
lsof |grep /var/log/messages
rm -f /var/log/messages
lsof |grep /var/log/messages
cat /proc/653/fd/6
cat /proc/653/fd/6 > /var/log/messages
==================================================
第一:占用该文件
[root11:43 AMcentos7 ~]#tail -f anaconda-ks.cfg
%packages
@^minimal
@core
kexec-tools
%end
%addon com_redhat_kdump --enable --reserve-mb='auto'
%end
第二:删除
[root11:44 AMcentos7 ~]#rm -rf anaconda-ks.cfg
第三:
[root11:44 AMcentos7 ~]#lsof |grep delete
看到anaconda-ks.cfg 文件
第四:追加恢复
[root11:46 AMcentos7 ~]#pidof tail
2925
[root11:46 AMcentos7 ~]#ll /proc/`pidof tail`/fd
total 0
lrwx------ 1 root root 64 May 19 11:46 0 -> /dev/pts/1
lrwx------ 1 root root 64 May 19 11:46 1 -> /dev/pts/1
lrwx------ 1 root root 64 May 19 11:46 2 -> /dev/pts/1
lr-x------ 1 root root 64 May 19 11:46 3 -> /root/anaconda-ks.cfg (deleted)
lr-x------ 1 root root 64 May 19 11:46 4 -> anon_inode:inotify
[root11:47 AMcentos7 ~]#cat /proc/`pidof tail`/fd/3 > anaconda-ks.cfg
[root11:49 AMcentos7 ~]#ll anaconda-ks.cfg
-rw-r--r-- 1 root root 1248 May 19 11:49 anaconda-ks.cfg
~~~
### **CentOS 8** **新特性** **cockpit**
Cockpit 是CentOS 8 取入的新特性,是一个基于 Web 界面的应用,它提供了对系统的图形化管理
监控系统活动(CPU、内存、磁盘 IO 和网络流量)
查看系统日志条目
查看磁盘分区的容量
查看网络活动(发送和接收)
查看用户帐户
检查系统服务的状态
提取已安装应用的信息
查看和安装可用更新(如果以 root 身份登录)并在需要时重新启动系统
打开并使用终端窗口
* 安装 cockpit
~~~sh
[root@centos8 ~]#dnf -y install cockpit
[root@centos8 ~]#systemctl enable --now cockpit.socket
Created symlink /etc/systemd/system/sockets.target.wants/cockpit.socket →
/usr/lib/systemd/system/cockpit.socket.
打开浏览器,访问以下地址:
https://centos8主机:9090
~~~
### **信号发送** **kill**
![](D:\云计算\17.进程和计划任务\30.png)
![](D:\云计算\17.进程和计划任务\31.png)
![](D:\云计算\17.进程和计划任务\32.png)
kill:内部命令,可用来向进程发送控制信号,以实现对进程管理,每个信号对应一个数字,信号名称以
SIG开头(可省略),不区分大小写
显示当前系统可用信号:
~~~sh
kill -l 或者 -L
trap -l
kill -l 查看信号的种类
~~~
查看帮助:man 7 signal
常用信号:
~~~sh
1) SIGHUP 无须关闭进程而让其重读配置文件,无须重启服务来完成 #Linux好多时候改配置文件,平滑生效
2) SIGINT 中止正在运行的进程;相当于Ctrl+c
3) SIGQUIT 相当于ctrl+\
9) SIGKILL 强制杀死正在运行的进程
15) SIGTERM 终止正在运行的进程,默认信号
18) SIGCONT 继续运行
19) SIGSTOP 后台休眠
~~~
指定信号的方法 :
* 信号的数字标识:1, 2, 9
* 信号完整名称:SIGHUP,sighup
* 信号的简写名称:HUP,hup lsof -i :80 找到进程 ps aux 找到进程号
向进程发送信号:
按PID:
~~~sh
kill [-s sigspec | -n signum | -sigspec] pid | jobspec ... or kill -l [sigspec]
~~~
~~~sh
kill -1 pid …
kill -n 9 pid
kill -s SIGINT pid
# 9信号不被trap捕获
~~~
按名称:killall 来自于psmisc包
killall [-SIGNAL] comm… 直接接命令,无须查询PID 而且一次将所有的全部删除,比如说一次杀死所有的ping ( killall
按模式:
pkill [options] pattern
~~~sh
-SIGNAL
-u uid: effective user,生效者
-U uid: real user,真正发起运行命令者
-t terminal: 与指定终端相关的进程
-l: 显示进程名(pgrep可用)
-a: 显示完整格式的进程名(pgrep可用)
-P pid: 显示指定进程的子进程
~~~
#### 范例:查看HUP信号
~~~sh
#许多服务的支持的reload操作,实际就是发送了HUP信号
#service httpd reload 即相当于 killall -1 httpd
[root@centos6 ~]#grep -A 10 -w reload -m 1 /etc/init.d/httpd
reload() {
echo -n $"Reloading $prog: "
if ! LANG=$HTTPD_LANG $httpd $OPTIONS -t >&/dev/null; then
RETVAL=6
echo $"not reloading due to configuration syntax error"
failure $"not reloading $httpd due to configuration syntax error"
else
# Force LSB behaviour from killproc
LSB=1 killproc -p ${pidfile} $httpd -HUP
RETVAL=$?
if [ $RETVAL -eq 7 ]; then
[root@centos6 ~]#
~~~
### 范例:利用 0 信号实现进程的健康性检查
~~~sh
[root@centos8 ~]#man kill
If signal is 0, then no actual signal is sent, but error checking is still
performed. 检查检查是否有错误,有的服务进程除了问题,可以检查
[root@centos8 ~]#killall -0 ping
[root@centos8 ~]#echo $?
0
[root@centos8 ~]#killall -0 ping
ping: no process found
[root@centos8 ~]#echo $?
1#此方式有局限性,即使进程处于停止或僵尸状态,此方式仍然认为是进程是健康的
ctrl+z变成停止态
~~~
![](D:\云计算\17.进程和计划任务\33.png)
![](D:\云计算\17.进程和计划任务\34.png)
![](D:\云计算\17.进程和计划任务\35.png)
![](D:\云计算\17.进程和计划任务\36.png)
* 查看进程的健康状态
~~~sh
wang 17129 0.0 0.2 32412 2276 pts/2 T 12:54 0:00 ping 10.0.0.8
root 17185 0.0 0.0 0 0 ? I 12:58 0:00 [kworker/0:1-ata_sff]
root 17205 0.0 0.4 57820 3928 pts/1 R+ 12:59 0:00 ps aux
[root12:59 PMcentos8 ~]#killall -0 ping
[root01:00 PMcentos8 ~]#echo $?
0
[root01:02 PMcentos8 ~]# kill -0 17129
[root01:02 PMcentos8 ~]#echo $?
0
~~~
### 前台和后台进程相互替换
![](D:\云计算\17.进程和计划任务\33.png)
![](D:\云计算\17.进程和计划任务\37.png)
![](D:\云计算\17.进程和计划任务\38.png)
![](D:\云计算\17.进程和计划任务\39.png)
~~~sh
# ctrl z 变成停止
[1]+ Stopped ping 127.0.0.1
# 变成后台运行态
[wang01:28 PMcentos8 ~]$kill -18 %1 #在当前的终端
ctrl c 只是针对前台进程
#后台恢复前台
jobs 显示任务
fg 编号
#一上来直接就是后台执行加 &: 不占用终端资源,窗口关了也就没了。依然依赖终端
例如
ping 10.0.0.6 &
即使把窗口关了,也执行,screen 不依赖终端窗口
关闭窗口的时候, screen会找找新的老大作为父进程,能找到新的父进程就不会被消灭
tmux是增强版的screen
** 关掉终端,进程依然能进行
后台作业虽然被送往后台运行,但其依然与终端相关;退出终端,将关闭后台作业。如果希望送往后台
后,剥离与终端的关系
nohup COMMAND &>/dev/null &
screen;COMMAND
tmux;COMMAND
查看当前终端所有作业:
jobs
~~~
### **并行运行**
利用后台执行,实现并行功能,即同时运行多个进程,提高效率
~~~sh
一条命令
#方法一:
[root@centos7: ~]#cat ping.sh
ping 127.1&
ping 127.2&
ping 127.3&
#方法二:
[root@centos7: ~]#(ping 127.1&);(ping 127.2&);(ping 127.3&)
#方法三:
[root@centos7: ~]#ping 127.1& ping 127.2& ping 127.3&
#多组命令实现并行, (两组里面是有顺序的,两组是并行的)
[root@centos8 ~]#{ ping -c3 127.1; ping 127.2; }& { ping -c3 127.3 ;ping 127.4;
}&
~~~
# 面试题:查看网段里面哪些主机开启
~~~sh
[root@centos8 ~]#cat scanhost.sh
#!/bin/bash
NET=10.0.0
for i in {1..254};do
{
ping -c1 -W1 ${NET}.${i} &> /dev/null && echo ${NET}.${i} is up || echo
${NET}.${i} is down
}&
done
wait
#wait 就执行完以后直接退出
~~~
# **任务计划**
通过任务计划,可以让系统自动的按时间或周期性任务执行任务
未来的某时间点执行一次任务
at
指定时间点,执行一次性任务
batch 系统自行选择空闲时间去执行此处指定的任务
周期性运行某任务
cron
**3.1** **一次性任务**
at 工具
由包 at 提供
依赖与atd服务,需要启动才能实现at任务
at队列存放在/var/spool/at目录中
执行任务时PATH变量的值和当前定义任务的用户身份一致
at 命令:
~~~sh
#特权suid权限
[root11:45 PMcentos7 ]#ll `which at`
-rwsr-xr-x. 1 root root 53048 Oct 30 2018 /usr/bin/at
~~~
~~~sh
[root@centos7: ~]#rpm -q at
at-3.1.13-24.el7.x86_64
[root@centos7: ~]#rpm -ql at
#服务的状态是启动的
[07:51:51 root@centos7]#yum install at -y
[07:54:03 root@centos7]#systemctl start atd
[07:54:20 root@centos7]#systemctl enable atd
[root@centos7: ~]#systemctl status atd.server 要是启动的状态
~~~
~~~sh
[root@centos7: ~]#date
Wed May 19 15:01:56 EDT 2021
[root@centos7: ~]#at 15:05 定义任务
at> echo $PATH
at> touch /txt.txts
at>
job 12 at Wed May 19 15:05:00 2021
按ctrl +d 保存退出
ctrl \ 不保存退出
[root@centos7: ~]#at -l 查看任务,作业未执行就可以看到
11 Sat May 8 00:16:00 2021 a root
12 Wed May 19 15:05:00 2021 a root
[root@centos7: ~]#ll /txt.txts
ls: cannot access /txt.txts: No such file or directory
[root@centos7: ~]#ll /txt.txts 任务已经完成
-rw-r--r-- 1 root root 0 May 19 15:05 /txt.txts
[root@centos7: ~]#
# echo $PATH以邮件的方式显示出来的,不是不打印,是被重定向到邮件里面
#如果定义的是过去时间,将是第二天的这个时间来执行的
[root@centos7: ~]#at 18:20 写的任务会放在 /var/spool/at/ 文件夹中
at> wall class over
at>
job 13 at Wed May 19 18:20:00 2021
[root@centos7: ~]#ll /var/spool/at/
total 8
---------- 1 root root 0 May 8 00:15 a0000b019c19e0
-rwx------ 1 root root 2711 May 19 15:36 a0000d019c5bfc
-rw-r--r-- 1 root root 26 May 7 23:53 at.txt
drwx------. 2 root root 6 May 19 15:05 spool
~~~
# centos 8 安装邮件服务器
![](D:\云计算\17.进程和计划任务\40.png)
#### 选项
~~~sh
at [option] TIME
-V 显示版本信息
-t time 时间格式 [[CC]YY]MMDDhhmm[.ss]
-l 列出指定队列中等待运行的作业;相当于atq
-d 删除指定的作业;相当于atrm
例如:删除一个计划任务
[root11:46 PMcentos7 ]#at -l
3 Sat May 8 23:36:00 2021 a wang
[root11:48 PMcentos7 ]#atrm 3
[root11:48 PMcentos7 ]#at -l
-c 查看具体作业任务
-f /path/file 指定的文件中读取任务
[root@centos7: ~]#touch /data/file
[root@centos7: ~]#at -f at.sh 15:59
job 16 at Wed May 19 15:59:00 2021
[root@centos7: ~]#at -l
16 Wed May 19 15:59:00 2021 a root
-m 当任务被完成之后,将给用户发送邮件,即使没有标准输出
-V 显示版本信息
-t time 时间格式 [[CC]YY]MMDDhhmm[.ss]
-l 列出指定队列中等待运行的作业;相当于atq
~~~
### 时间格式
~~~sh
HH:MM 在今日的 HH:MM 进行,若该时刻已过,则明天此时执行任务
02:00
HH:MM YYYY-MM-DD 规定在某年某月的某一天的特殊时刻进行该项任务
02:00 2016-09-20
HH:MM[am|pm] [Month] [Date]
06pm March 17
17:20 tomorrow
HH:MM[am|pm] + number [minutes|hours|days|weeks], 在某个时间点再加几个时间后才进行该
项任务
now + 5 min
02pm + 3 days
例如:
[root12:09 AMcentos7 ]#at now+1minutes
at> wall class over
at>
job 10 at Sat May 8 00:10:00 2021
[root12:09 AMcentos7 ]#at -l
8 Sat May 8 23:55:00 2021 a root
10 Sat May 8 00:10:00 2021 a root
[root12:09 AMcentos7 ]#
Broadcast message from root@centos7 (Sat May 8 00:10:00 2021):
class over
~~~
##### 删除计划任务
~~~sh
[root@centos7: ~]#at -l
11 Sat May 8 00:16:00 2021 a root
13 Wed May 19 18:20:00 2021 a root
[root@centos7: ~]#atrm 11
[root@centos7: ~]#atrm 13
[root@centos7: ~]#at -l
atrm等价于 at -d
~~~
作业执行命令的结果中的标准输出和错误以执行任务的用户身份发邮件通知给 root
默认CentOS 8 最小化安装没有安装邮件服务,需要自行安装
~~~sh
[root@centos8 ~]#dnf install postfix -y
[root@centos8 ~]#systemctl enable --now postfi
#安装邮件服务器,25号端口,保证能接收到邮件
~~~
### at 支持重定向或者管道
~~~sh
[root@centos7: ~]#cat at.sh
#!/bin/bash
ls /data/file
rm /data/file
[root@centos7: ~]#at 15:51 < at.sh
job 14 at Wed May 19 15:51:00 2021
[root@centos7: ~]#echo wall at job |at 15:51
job 15 at Wed May 19 15:51:00 2021
[root@centos7: ~]#at -l
14 Wed May 19 15:51:00 2021 a root
15 Wed May 19 15:51:00 2021 a root
~~~
### 定义黑名单和白名单
~~~sh
/etc/at.{allow,deny} 控制用户是否能执行at任务
白名单:/etc/at.allow 默认不存在,只有该文件中的用户才能执行at命令
黑名单:/etc/at.deny 默认存在,拒绝该文件中用户执行at命令,而没有在at.deny 文件中的使用
者则可执行
如果两个文件都不存在,只有 root 可以执行 at 命令
~~~
![](D:\云计算\17.进程和计划任务\43.png)
### **周期性任务计划** **cron**
![](D:\云计算\17.进程和计划任务\44.jpg)
![](D:\云计算\17.进程和计划任务\45.jpg)
# /usr/bin/run-parts
![](D:\云计算\17.进程和计划任务\46.jpg)
周期性任务计划cron相关的程序包:
* cronie:主程序包,提供crond守护进程及相关辅助工具
* crontabs:包含CentOS提供系统维护任务
* cronie-anacron:cronie的补充程序,用于监控cronie任务执行状况,如:cronie中的任务在过去该
* 运行的时间点未能正常运行,则anacron会随后启动一次此任务
cron 依赖于crond服务,确保crond守护处于运行状态:
~~~sh
#CentOS 7 以后版本:
systemctl status crond
#CentOS 6:
service crond status
~~~
cron任务分为
* 系统cron任务:系统维护作业,/etc/crontab 主配置文件, /etc/cron.d/ 子配置文件
**但是只有root用户才能编辑此文件,所以一般不编辑此文件**
* ![](D:\云计算\17.进程和计划任务\47.jpg)
* ![](D:\云计算\17.进程和计划任务\48.jpg)
* 用户cron任务:保存在 /var/spool/cron/USERNAME,利用 crontab 命令管理
计划任务日志:/var/log/cron
*
* 系统*cron计划任务 * 总配置文件
~~~sh
[root@centos8 ~]#cat /etc/crontab
SHELL=/bin/bash #默认的SHELL类型
PATH=/sbin:/bin:/usr/sbin:/usr/bin #默认的PATH变量值,可修改为其它路径
MAILTO=root #默认标准输出和错误发邮件给root,可以指向其它用户
# For details see man 4 crontabs
# Example of job definition:
# .---------------- minute (0 - 59)
# | .------------- hour (0 - 23)
# | | .---------- day of month (1 - 31)
# | | | .------- month (1 - 12) OR jan,feb,mar,apr ...
# | | | | .---- day of week (0 - 6) (Sunday=0 or 7) OR
sun,mon,tue,wed,thu,fri,sat
# | | | | |
# * * * * * user-name command to be executed
~~~
### 以什么样的用户写的定时任务,那么/var/spool/cron就是改文件名
~~~sh
[root10:10 AMcentos8 /var/spool/cron]#ls
root wang #以wang 编辑的任务那么在目录里面就生成wang这个文件
[root10:10 AMcentos8 /var/spool/cron]#cat wang
* * * * * echo $PATH
[root10:10 AMcentos8 /var/spool/cron]#pwd
/var/spool/cron
~~~
### 修改export EDITOR=vim 保证crontab -e 有颜色
~~~sh
调用vim编辑器,默认是vi
[root07:21 AMcentos8 /etc/cron.d]#cat /etc/profile.d/clore.sh
PS1="\[\e[1;34m\][\u\@\h \w]\\$\[\e[0m\]"
export EDITOR=vim
~~~
# 每个月日期和星期几冲突
![](D:\云计算\17.进程和计划任务\50.png)
### 日志的记录
~~~sh
[root@centos7: ~]#tail /var/log/cron -f
~~~
# 邮件接收任务
![](D:\云计算\17.进程和计划任务\49.png)
计划任务时间表示法
~~~sh
(1) 特定值
给定时间点有效取值范围内的值
(2) *
给定时间点上有效取值范围内的所有值
表示“每...”
(3) 离散取值
计划任务时间表示法:
范例:
crond任务相关文件:
3.2.2 anacron
#,#,#
(4) 连续取值
#-#
(5) 在指定时间范围上,定义步长
/#: #即为步长
(6) 特定关健字
@yearly 0 0 1 1 *
@annually 0 0 1 1 *
@monthly 0 0 1 * *
@weekly 0 0 * * 0
@daily 0 0 * * *
@hourly 0 * * * *
@reboot Run once after reboot
[root06:41 AMcentos8 /etc/cron.d]#cat /etc/cron.d/0hourly
# Run the hourly jobs
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
01 * * * * root run-parts /etc/cron.hourly
# 每小时的第一分钟执行
+++++++++++++++++++++++++++++++++++++
*/2 * * * * 每2分钟执行一次
* * * * * 每分钟执行一次
#晚上9点10分运行echo命令
10 21 * * * wang /bin/echo "Howdy!"
#每3小时echo和wall命令
0 */3 * * * wang /bin/echo “howdy”; wall “welcome to Magedu!”
#星期和日期不一致那么就是或关系
01 * * * * root run-parts /etc/cron.hourly
#每个小时的第一分钟执行 run-parts /etc/cron.hourly
~~~
### 范例:
~~~sh
#晚上9点10分运行echo命令
10 21 * * * wang /bin/echo "Howdy!"
#每3小时echo和wall命令
0 */3 * * * wang /bin/echo “howdy”; wall “welcome to Magedu!”
~~~
* crond任务相关文件:
~~~sh
/etc/crontab 配置文件
/etc/cron.d/ 配置文件
/etc/cron.hourly/ 脚本
/etc/cron.daily/ 脚本
/etc/cron.weekly/ 脚本
/etc/cron.monthly/ 脚本
~~~
# /etc/cron.d
**各自的用户将计划任务放在此/etc/cron.d 目录中互不干扰**
~~~sh
[root@centos7: ~]#cd /etc/cron.d #子配置文件
[root@centos7: cron.d]#ls
0hourly sysstat test
[root@centos7: cron.d]#cat /etc/crontab #总的配置文件。root使用
~~~
### 编写计划任务
~~~sh
[root@centos7: ~]#crontab -e
~~~
### crontab 的常用选项
~~~sh
-l 列出所有任务
-e 编辑任务
-r 移除所有任务
-i 同-r一同使用,以交互式模式移除指定任务
-u user 仅root可运行,指定用户管理cron任务
-u user 仅root可运行,指定用户管理cron任务
例如: crontab -e -u wang 不用切换到wang的情况下用wang 的身份编辑
~~~
范例:每个月日期和星期几字段的关系
~~~sh
[root@centos8 ~]#man 5 crontab
Note: The day of a command's execution can be specified in the following two
fields — 'day of month', and 'day of week'. If both fields are restricted
(i.e., do not contain the "*" character), the command will be run when either
field matches the current time. For example, "30 4 1,15 * 5" would cause a
command to be run at 4:30 am on the 1st and 15th of each month, plus every
Friday
~~~
范例:修改默认的cron的文本编辑工具,修改配置以后带颜色
~~~sh
root@ubuntu1804:~# crontab -e
no crontab for root - using an empty one
Select an editor. To change later, run 'select-editor'.
1. /bin/nano <---- easiest
2. /usr/bin/vim.basic
3. /usr/bin/vim.tiny
4. /bin/ed
Choose 1-4 [1]:
root@ubuntu1804:~# cat /etc/profile.d/env.sh
export EDITOR=vim
~~~
# 面试题:11月每天的6-12点之间每隔2小时执行/app/bin/test.sh
~~~sh
[root@centos8 ~]#crontab -l
0 6-12/2 * 11 * /app/bin/test.sh
~~~
### PATH变量
~~~~sh
/etc/crontab 的变量太少,所以要自己多写PATH环境变量
[root@centos8 ~]#crontab -l
PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin
* * * * * useradd hehe;echo $PATH
~~~~
# 面试题:每十分钟检查磁盘空间
~~~sh
WARNING=10
df | sed -En '/^\/dev\/sd/s@^([^ ]+).* ([0-9]+)%.*@\1 \2@p'| while read DEVICE
USE;do
[ $USE -gt $WARNING ] && echo "$DEVICE will be full,USE:$USE" | mail -s
diskfull root
done
[root@centos8 ~]#crontab -l
*/10 * * * * check_disk.sh
WARNING=2
df | awk -F ' +|%' '/^\/dev\/sd/{print $1,$5}'|while read DISK USE;do
if [ $USE -gt $WARNING ];then
echo "$DISK will be full,use:$USE" | mail -s diskwarning
root@wangxiaochun.com
fi
done
[root@centos8 ~]#crontab -l
*/10 * * * * /root/check_disk2.sh
df | awk -F ' +|%' '/^\/dev\/sd/{if($5 > 10){system("echo "$1" will be
full,use:" $5 "| mail -s warning root@wangxiaochun.com")} }'
[root@centos8 ~]#crontab -l
*/10 * * * * /root/check_disk.sh
~~~
![](D:\云计算\17.进程和计划任务\51.png)
#### 用户的计划任务存放地方
~~~sh
用户以自己的身份用crontab -e 创建计划任务,保存在磁盘文件/var/spool/cron/ ,文件名就是同用户名
[root@centos7: cron]#ls /var/spool/cron/wang
~~~
#### cron任务中不建议使用%
~~~sh
cron任务中不建议使用%,它有特殊用途,它表示换行的特殊意义,且第一个%后的所有字符串会被将
成当作命令的标准输入
如果在命令中要使用%,则需要用 \ 转义
注意:将%放置于单引号中是不支持的
30 2 * * * /bin/cp -a /etc/ /data/etc`date +\%F_\%T`
30 2 * * * /bin/cp -a /etc/ /data/etc`date +‘%F_%T’` 有问题
~~~
### 如何在秒级别运行任务?
~~~sh
for min in 0 1 2; do echo "hi"; sleep 20; done
~~~
如何实现每7分钟运行一次任务?
![](D:\云计算\17.进程和计划任务\52.png)
~~~sh
60除以7 不能整除
sleep命令:
sleep NUMBER[SUFFIX]...
SUFFIX:
s: 秒, 默认
m: 分
h: 小时
d: 天
[root@centos8 ~]#usleep
warning: usleep is deprecated, and will be removed in near future!
warning: use "sleep 1e-06" instead...
[root@centos8 ~]#time usleep 1000000 #判断命令的执行时间
warning: usleep is deprecated, and will be removed in near future!
warning: use "sleep 1" instead...
real 0m1.001s
user 0m0.001s
sys 0m0.000s
You have new mail in /var/spool/mail/root
[root@centos8 ~]#time ls
all.sh anaconda-ks2.cfg at.txt scanhost.sh
real 0m0.004s
user 0m0.001s
sys 0m0.003s
[root@centos8 ~]#time sleep 0.2
real 0m0.202s
user 0m0.001s
sys 0m0.000s
~~~
![](D:\云计算\17.进程和计划任务\53.png)
![](D:\云计算\17.进程和计划任务\54.png)
![](D:\云计算\17.进程和计划任务\55.png)
# 日志切割
第一步:编写脚本,且给脚本一个执行权限
![](D:\云计算\17.进程和计划任务\56.png)
第二步:编写 crontab -e
![](D:\云计算\17.进程和计划任务\57.png)
# 练习
练习
1、每周的工作日1:30,将/etc备份至/backup目录中,保存的文件名称格式为“etcbak-yyyy-mm-dd-
HH.tar.xz”,其中日期是前一天的时间
~~~sh
第一步:编写脚本给执行权限
[root@backup]#cat /scripts/32.sh
#!/bin/bash
mkdir /backup -p
tar -cf /backup/etcback-`date -s "-1 day" +%F-%H-%M-%S`.tar.xz /etc
[root@backup]#ll !$
ll /scripts/32.sh
-rwxr-xr-x. 1 root root 100 Jun 18 2021 /scripts/32.sh
第二步:编写crontab -e
[root@backup]#crontab -e
30 1 * * 1-5 /scripts/32.sh &>/dev/null
~~~
2、每两小时取出当前系统/proc/meminfo文件中以S或M开头的信息追加至/tmp/meminfo.txt文件中
~~~sh
[root@scripts]#cat 33.sh
#!/bin/bash
grep -E -e ^S -e ^M /proc/meminfo >>/tmp/meminfo.txt
# grep ^[S\|M].* /proc/meminfo >>/tmp/meminfo.txt
[root@scripts]#ll 33.sh
-rwxr-xr-x. 1 root root 70 Jun 13 18:19 33.sh
[root@scripts]#crontab -l
30 1 * * 1-5 /scripts/32.sh &>/dev/null
* */2 * * * /scripts/33.sh &>/dev/null
~~~
3、工作日时间,每10分钟执行一次磁盘空间检查,一旦发现任何分区利用率高于80%,就执行wall警
报
~~~sh
第一步:写脚本给执行权限
[root@scripts]#cat 34.sh
#!/bin/bash
df |awk -F" +|%" '/^\/dev\/sd*/{print $1,$5}' |while read DISK USE;do
[ $USE -gt 80 ] && echo "$DISK will full,USED:$USE" |mail -s "Diskfull_Info" root
done
[root@scripts]#ll 33.sh
-rwxr-xr-x. 1 root root 70 Jun 13 18:19 33.sh
第二步编辑 crontab -e
[root@scripts]#crontab -l
30 1 * * 1-5 /scripts/32.sh &>/dev/null
* */2 * * * /scripts/33.sh &>/dev/null
*/10 * * * * /scripts/33.sh &>/dev/null
~~~