21 liunx shell编程 简述awk命令; BEGIN命令, END命令,内建变量 NF NR FS;awk 的逻辑运算;print 和 printf 的区别

简述awk命令,BEGIN命令, END命令, 内建变量 NF NR FS,

21 liunx shell编程 简述awk命令; BEGIN命令, END命令,内建变量 NF NR FS;awk 的逻辑运算;print 和 printf 的区别

awk 也是一个非常棒的数据处理工具。
awk 用来截取符合条件的列。
awk 的功能远比cut强大;甚至可以称之为awk编程。

awk命令

格式:

awk '条件1{动作1} 条件2{动作2} ...' filename

含义:

  • awk 后面接单引号,引号内会有多个条件和动作 条件{动作} 就像java中的if else一样,满足条件1执行动作1。
  • awk 可以处理后续接的文件,也可以读取来自前个命令的 standard output 。
  • awk 主要是处理『每一行的栏位内的数据』,而默认的『栏位的分隔符号为 “空白键” 或 “[tab]键” 』!
[userwin@MiWiFi-R3L-srv ~]$ df -h
文件系统                 容量  已用  可用 已用% 挂载点
/dev/mapper/centos-root   18G  2.0G   16G   12% /
devtmpfs                 479M     0  479M    0% /dev
tmpfs                    489M     0  489M    0% /dev/shm
tmpfs                    489M  6.7M  483M    2% /run
tmpfs                    489M     0  489M    0% /sys/fs/cgroup
/dev/sda1                497M  107M  391M   22% /boot
tmpfs                     98M     0   98M    0% /run/user/1000
# 想使用cut 命令获取上面内容的第二列内容;结果出乎意料了吧? 
[userwin@MiWiFi-R3L-srv ~]$ df -h | cut -d " " -f2







# 文件系统后面列后面跟多个空格,cut命令无法识别。awk命令刚好解决这个问题。
[userwin@MiWiFi-R3L-srv ~]$ df -h | awk '{print $2}'
容量
18G
479M
489M
489M
489M
497M
98M

文件系统后面列后面跟多个空格,cut命令无法识别;如下图:
21 liunx shell编程 简述awk命令; BEGIN命令, END命令,内建变量 NF NR FS;awk 的逻辑运算;print 和 printf 的区别

获取第二列和第六列 df -h | awk ‘{print $2 “\t” $6}’
点引号后面直接跟{print 此处省略了条件。默认为true。
awk 最常使用的动作!透过 print 的功能将栏位数据列出来!栏位的分隔则以空白键或 [tab] 按键来隔开

[userwin@MiWiFi-R3L-srv ~]$ df -h | awk '{print $2 "\t" $6}'
容量	挂载点
18G	/
479M	/dev
489M	/dev/shm
489M	/run
489M	/sys/fs/cgroup
497M	/boot
98M	/run/user/1000

print 和 printf 的区别

在awk语句中,printf 输出不会换行,需要手动加入\n
且看下面示例:

[userwin@MiWiFi-R3L-srv ~]$ df -h | awk '{print $2 "\t" $6}'
容量	挂载点
18G	/
479M	/dev
489M	/dev/shm
489M	/run
489M	/sys/fs/cgroup
497M	/boot
98M	/run/user/1000
[userwin@MiWiFi-R3L-srv ~]$ df -h | awk '{printf $2 "\t" $6}'
容量	挂载点18G	/479M	/dev489M	/dev/shm489M	/run489M	/sys/fs/cgroup497M	/boot
[userwin@MiWiFi-R3L-srv ~]$ df -h | awk '{printf $2 "\t" $6 "\n"}'
容量	挂载点
18G	/
479M	/dev
489M	/dev/shm
489M	/run
489M	/sys/fs/cgroup
497M	/boot
98M	/run/user/1000

获取sda1 已经第5列%前面的数字

# 查看
[userwin@MiWiFi-R3L-srv ~]$ df -h 
文件系统                 容量  已用  可用 已用% 挂载点
/dev/mapper/centos-root   18G  2.0G   16G   12% /
devtmpfs                 479M     0  479M    0% /dev
tmpfs                    489M     0  489M    0% /dev/shm
tmpfs                    489M  6.7M  483M    2% /run
tmpfs                    489M     0  489M    0% /sys/fs/cgroup
/dev/sda1                497M  107M  391M   22% /boot
tmpfs                     98M     0   98M    0% /run/user/1000
# 获取sda1 行
[userwin@MiWiFi-R3L-srv ~]$ df -h | grep "sda1" 
/dev/sda1                497M  107M  391M   22% /boot
# 获取第5列
[userwin@MiWiFi-R3L-srv ~]$ df -h | grep "sda1" | awk '{print $5}'
22%
# 使用cut截取%前面的数值
[userwin@MiWiFi-R3L-srv ~]$ df -h | grep "sda1" | awk '{print $5}' |cut -d '%' -f1
22

awk 的内建变量 NF NR FS

awk命令: 每一行的每个栏位都是有变量名称的,那就是 $1, $2… 等变量名称 每个栏位就对应的每一列。$1指第一列;
$0 代表『一整列数据』的意思

变量名称 代表意义
NF 每一行 ($0) 拥有的栏位总数
NR 目前 awk 所处理的是『第几行』数据
FS 目前的分隔字节,默认是空白键
# 查看passwd文件中包含/bin/bash 的内容
[userwin@MiWiFi-R3L-srv ~]$ cat /etc/passwd | grep "/bin/bash"  
root:x:0:0:root:/root:/bin/bash
userwin:x:1000:1000:userwin:/home/userwin:/bin/bash
# 使用awk自定义分隔符获取1,3两列
[userwin@MiWiFi-R3L-srv ~]$ cat /etc/passwd | grep "/bin/bash" | awk '{FS=":"} {print $1 "\t" $3}'
root:x:0:0:root:/root:/bin/bash	
userwin	1000

第一个列为什么没有执行分割呢?

看一下awk的执行顺序,先读入第一行,读完才执行FS=:这个分隔符,故而出现如下图情况

21 liunx shell编程 简述awk命令; BEGIN命令, END命令,内建变量 NF NR FS;awk 的逻辑运算;print 和 printf 的区别
需要使用BEGIN命令添加一个空行,如下

[userwin@MiWiFi-R3L-srv ~]$ cat /etc/passwd | grep "/bin/bash" |\
 awk 'BEGIN{FS=":"} {print $1 "\t" $3}'
root	0
userwin	1000

awk的执行顺序

  1. 先读入第一行,并将第一行的数据填入 $0, $1, $2… 等变量当中;
  2. 依据 “条件类型” 的限制,判断是否需要进行后面的 “动作”;
  3. 做完所有的动作与条件类型;
  4. 若还有后续的『行』的数据,则重复上面 1~3 的步骤,直到所有的数据都读完为止。

awk 中的BEGIN

BEGIN 处理数据前加入内容

[userwin@MiWiFi-R3L-srv ~]$ df -h | grep "sda1" | awk 'BEGIN{print "sda1的使用率为:"}{print $5}' 
sda1的使用率为:
22%
[userwin@MiWiFi-R3L-srv ~]$ df -h | grep "sda1" | awk 'BEGIN{printf "sda1的使用率为:"}{print $5}' 
sda1的使用率为:22%

awk 中的END

BND 处理数据后加入内容

[userwin@MiWiFi-R3L-srv ~]$ df -h | grep "sda1" | awk 'BEGIN{print "sda1的使用率为:"} END{print "命令执行完 毕!!"}{print $5}' 
sda1的使用率为:
22%
命令执行完毕!!

awk 的逻辑运算

运算单元 代表意义
> 大於
< 小於
>= 大於或等於
<= 小於或等於
== 等於
!= 不等於
[userwin@MiWiFi-R3L-srv ~]$ df -h | grep "sda1" | awk '{print $5}' | awk 'BEGIN{FN="%"} $1>=20{print "磁盘使 用率超过20%"}'
磁盘使用率超过20%
[userwin@MiWiFi-R3L-srv ~]$ df -h | grep "sda1" | awk '{print $5}' | awk 'BEGIN{FN="%"} $1>=80{print "磁盘使 用率超过80%"} $1<80{print "磁盘使用率未超过80%"}'
磁盘使用率未超过80%

上一篇:[论文笔记]Teaching Machines to Read and Comprehend


下一篇:高频电子技术网课答案