Linux下awk理解

一、AWK简介

awk 是一种处理文本文件的语言,是一个强大的文本分析工具。awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。

awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本。

awk 其名起自三位创始人 Alfred Aho,Peter Weinberger, 和 Brian Kernighan 的 Family Name 的首字符。

二、用法

语法:awk '{pattern + action}' {filenames}

   pattern 表示 AWK 在数据中查找的内容,而 action 是在找到匹配内容时所执行的一系列命令。花括号({})不需要在程序中始终出现,但它们用于根据特定的模式对一系列指令进行分组。

   pattern就是要表示的正则表达式,用斜杠括起来。

   awk语言的最基本功能是在文件或者字符串中基于指定规则浏览和抽取信息,awk抽取信息后,才能进行其他文本操作。完整的awk脚本通常用来格式化文本文件中的信息。

三、内置函数

$0                 变量是指整条记录
$1~$n           表示当前行的第一个域,$2表示当前行的第二个域,...
FS                 设置字段分隔符,默认是空格,等价于命令行 -F选项
RS                 输入记录分隔符,默认是换行符
NF                 当前记录中字段的个数,即有多少列
NR                 已读的记录数,即行数,从1开始
OFS               输出字段分隔符,默认是空格
ORS               输出记录分隔符,默认是换行符

例子:

[root@localhost /]# vi 1
文件系统     1K-块          已用      可用    已用%    挂载点
devtmpfs 1580452         0    1580452   0% /dev
tmpfs      1597460         0    1597460   0% /dev/shm
tmpfs      1597460     9712   1587748  1% /run
tmpfs      1597460 0 1597460 0% /sys/fs/cgroup
/dev/mapper/centos-root 6486016 5148040 1337976 80% /
/dev/sda1 1038336 187648 850688 19% /boot
tmpfs     319492 8 319484 1% /run/user/42
tmpfs     319492 0 319492 0% /run/user/0
tmpfs    319492 36 319456 1% /run/user/1000
[root@localhost /]# awk '{if(NR>=3 && NR<=6)print $0}' 1
tmpfs                   1597460       0 1597460    0% /dev/shm
tmpfs                   1597460    9712 1587748    1% /run
tmpfs                   1597460       0 1597460    0% /sys/fs/cgroup
/dev/mapper/centos-root 6486016 5148040 1337976   80% /
[root@localhost /]# awk '{if(NR>=3 && NR<=6)print $1}' 1
tmpfs
tmpfs
tmpfs
/dev/mapper/centos-root
[root@localhost /]# awk '{if(NR>=3 && NR<=6)print $2}' 1
1597460
1597460
1597460
6486016

 

上一篇:Burnside 引理学习笔记


下一篇:【CF1349D】Slime and Biscuits(势能函数)