说明:
awk被设计用于数据流,能够对列和行进行操作。而sed更多的是匹配,进行替换和删除。
awk有很多内建的功能,比如数组,函数等。灵活性是awk的最大优势。
awk的结构
}{i++}END{print i}' filename
工作原理
awk命令的工作方式如下:
1. 执行BEGIN{commands}语句块中的语句
2. 从文件或者stdin中读取一行,然后执行pattern{commands}. 迭代直到全部读取完毕
3. 最后执行END{commands}语句块
="$0,"$1="$1,"$2="$2,"$3="$3
;print "Summation:"}{print $1"+";sum+=1}END{print "==";print sum}'
还有另一种灵活的方法可以将多个外部变量传递给awk,例如:
- $var1="value1" var2="value2"
- $echo | awk '{print v1,v2}' v1=$var1 v2=$var2
如果来自文件
- awk '{print v1,v2}' v1=$var1 v2=$var2 filename
例4
$awk 'NR < 5' #行号小于5
$awk 'NR==1,NR==4' #行号在1到5之间的行
$awk '/linux/' #包含样式linux的行(可以用正则表达式指定样式)
$awk '!/linux/' #不包含样式linux的行
再介绍几个awk内置的字符串函数,也讲一部分。
length(string): //返回字符串的长度 index(string,serch_string): //返回search_string在字符串中出现的位置 split(string,array,delimiter): //用定界符生成一个字符串列表,并将该列表存入数组 substr(string,array,delimiter): //在字符串中用字符起止便宜量生成子串,并返回该子串 sub(regex,replacement_str,string): //将正则表达式匹配到的第一处内容替换成replacement_str gsub(regex,replacement_str,string): //和sub()类似。不过该函数会替换正则表达式匹配到的所有内容 match(regex,string): //检查正则表达式是否能够匹配字符串。如果能够匹配,返回非0值;否则,返回0.match()有两个相关的特殊变量,分别是RSTART喝RLENGTH。变量RSTART包含正则表达式所匹配内容的其实位置,而变量RLENGTH包含正则表达式所匹配内容的长度。
举例:
1.
- $ awk '{ sub(/test/, "mytest"); print }' testfile
在整个记录中匹配,替换只发生在第一次匹配发生的时候
2.
- $ awk '{ sub(/test/, "mytest"); $1}; print }' testfile
在整个记录的第一个域中进行匹配,替换只发生在第一次匹配发生的时候
3.
- $ awk '{ print index("test", "mytest") }' testfile
实例返回test在mytest的位置,结果应该是3
4.
- $ awk '{ print length( "test" ) }'
实例返回test字符串的长度。
本文出自:http://yjplxq.blog.51cto.com/4081353/964519