shell脚本—awk

2023-09-30 14:35:16

一、awk命令
二、awk具体操作
三、awk与getline
四、awk其他用法
- 4.1 指定分隔符来分隔字符串
- 4.2 使用awk创建数组，并循环

一、awk命令

1.1 用途

awk文本和数据处理编程语言

1.2 工作原理

1.逐行读取文本，默认以空格或tab键为分隔符进行分隔，将分隔所得的各个字段保存到内建变量中，并按模式或者条件执行编辑命令
2.sed命令常用于一整行的处理，而awk比较倾向于将一行分成多个“字段”然后再进行处理。awk信息的读入也是逐行读取的，执行结果可以通过print的功能将字段数据打印显示。在使用awk命令的过程中,可以使用逻辑操作符“&&”表示“与”、“||”表示“或”、“！”表示“非”；还可以进行简单的数学运算，如+、-、*、/、%、^分别表示加、减、乘、除、取余和乘方

1.3 命令格式

1.awk 选项 ‘模式或条件 {操作}‘ 文件1 文件2 ...

2.awk -f 脚本文件文件1 文件2 ...

1.4 awk常见的内建变量（可直接使用）

内建变量	说明
FS	列分割符。指定每行文本的字段分隔符，默认为空格或制表位。与"-F"作用相同
NF	当前处理的行的字段个数
NR	当前处理的行的行号（序数）
$0	当前处理的行的整行内容
$n	当前处理行的第n个字段（第n列）
FILENAME	被处理的文件名
RS	行分隔符。awk从文件上读取资料时，将根据RS的定义把资料切割成许多条记录，而awk一次仅读入一条记录，以进行处理。预设值是‘\n‘
FNR	awk当前读取的记录数，其变量值小于等于NR（比如当读取第二个文件时，FNR是从0开始重新计数，而NR不会）。NR==FNR：用于在读取两个或两个以上的文件时，判断是不是在读取第一个文件

二、awk具体操作

2.1 按行输出文本

BEGIN模式表示，在处理指定的文本之前，需要先执行BEGIN模式中指定的动作；awk再处理指定的文本，之后再执行END模式中指定的动作，END{}语句块中，往往会放入打印结果等语句

2.2 按字段输出文本

2.3 通过管道、双引号调用Shell命令

1.统计$PATH目录下以冒号分隔的行数
echo $PATH | awk ‘BEGIN{RS=":"};END{print NR}‘

2.统计使用bash的用户个数，等同于grep -c
awk -F : ‘/bash$/ {print | "wc -l"}‘ /etc/passwd
grep -c "bash$" /etc/passwd

3.查看当前内存使用百分比
free -m | awk ‘/Mem:/ {print int($3/($3+$4)*100)"%"}‘

4.查看当前CPU空闲率（-b -n 1 输出一次），cpu会一直变化
top -b -n 1 | grep Cpu | awk -F , ‘{print $4}‘ | awk ‘{print $1}‘

5.显示上次系统重启时间，等同于uptime命令
date -d "$(awk -F . ‘{print $1}‘ /proc/uptime) second ago" +"%F %H:%M:%S"

三、awk与getline

3.1 用法

1.当getline左右无重定向符“<”或“|”时，getline作用于当前文件，读入当前文件的第一行给其后跟的变量var或$0；应该注意到，由于awk在处理getline之前已经读入了一行，所以getline得到的返回结果是隔行的
2.当getline左右有重定向符“<”或“|”时，getline则作用于定向输入文件，由于该文件是刚打开，并没有被awk读入一行，只是getline读入，那么getline返回的是该文件的第一行，而不是隔行

3.2 有重定向符或|

1.调用w命令，统计在线用户数
awk ‘BEGIN {n=0;while("w" | getline) n++;{print n-2}}‘

2.调用hostname，输出当前主机名
awk ‘BEGIN {"hostname" | getline ; {print $0}}‘

3.3 无重定向符或|

四、awk其他用法

4.1 指定分隔符来分隔字符串

$1=$1是用来激活$0的重新赋值,也就是说
字段$1…和字段数NF的改变会促使awk重新计算$0的值,通常是在改变OFS后而需要输出$0时这样做

4.2 使用awk创建数组，并循环