sed的基本操作
sed 's/a/b/g' 文件a 把文件a中的a修改成b 注意这只是临时的
注:s就是所有的意思,g是缓存区的意思
sed -i 's/a/b/g' 文件a 把文件a中的a修改成b 这是修改了文件中的
sed -i's/^/&a/g' 文件b 在文件b中的每一行的开头增加1个a
sed -i 's/$/a/g' 文件b 在文件b中的每一行的结尾增加1个a
sed -i'/weimengle/a xxxx' 文件b 在文件b中找到weimengle,在weimengle这一行之后添加xxxx
注:a就是after的缩写
sed -i'/weimengle/i xxxx' 文件b 在文件b中找到weimengle,在weimengle这一行之前添加xxxx
sed -n'/weimengle/p' 文件b 在文件b中找到weimengle这一行并打印出来
注:p就是print的缩写
sed -n '1p' 文件b 打印文件b中的第一行
sed -n '1,2p' 文件b 打印文件b中的第一行到第五行
sed删除文件中的内容
如果是要删除第三行:
sed -i '3d' 1.txt
注:d就是delete的缩写
如果删除以Love开头的行
sed -i '/^Love/d'1.txt
删除包含Love的行
sed -i '/Love/d'1.txt
awk中的循环和判断语句
awk条件语句
条件语句
awk中的条件语句是从C语言中借鉴过来的,可控制程序的流程。
if语句
格式:
{if (expression){
statement; statement; ...
}
}
$ awk '{if ($1 <$2) print $2 "too high"}' test。如果第一个域小于第二个域则打印。
$ awk '{if ($1 < $2) {count++; print "ok"}}' test.如果第一个域小于第二个域,则count加一,并打印ok。
if/else语句,用于双重判断。
格式:
{if (expression){
statement; statement; ...
}
else{
statement; statement; ...
}
}
$ awk '{if ($1 > 100) print $1 "bad" ; else print "ok"}'test。如果$1大于100则打印$1 bad,否则打印ok。
$ awk '{if ($1 > 100){ count++; print $1} else {count--; print $2}' test。如果$1大于100,则count加一,并打印$1,否则count减一,并打印$1。
if/else else if语句,用于多重判断。
格式:
{if (expression){
statement; statement; ...
}
else if (expression){
statement; statement; ...
}
else if (expression){
statement; statement; ...
}
else {
statement; statement; ...
}
}
循环
*
awk有三种循环:while循环;for循环;special for循环。
*
$ awk '{ i = 1; while ( i <= NF ) { print NF,$i; i++}}' test。变量的初始值为1,若i小于可等于NF(记录中域的个数),则执行打印语句,且i增加1。直到i的值大于NF.
*
$ awk '{for (i = 1; i *
breadkcontinue语句。break用于在满足条件的情况下跳出循环;continue用于在满足条件的情况下忽略后面的语句,直接返回循环的顶端。如:
{for ( x=3; x<=NF; x++)
if ($x<0){print "Bottomed out!"; break}}
{for ( x=3; x<=NF; x++)
if ($x==0){print "Get next item"; continue}}
*
next语句从输入文件中读取一行,然后从头开始执行awk脚本。如:
{if ($1 ~/test/){next}
else {print}
}
*
exit语句用于结束awk程序,但不会略过END块。退出状态为0代表成功,非零值表示出错。
数组
awk中的数组的下标可以是数字和字母,称为关联数组。
下标与关联数组
*
用变量作为数组下标。如:$ awk {name[x++]=$2};END{for(i=0;i *
special for循环用于读取关联数组中的元素。格式如下:
{for (item in arrayname){
print arrayname[item]
}
}
$ awk '/^tom/{name[NR]=$1}; END{for(i in name){print name[i]}}' test。打印有值的数组元素。打印的顺序是随机的。
*
用字符串作为下标。如:count["test"]
*
用域值作为数组的下标。一种新的for循环方式,for (index_value in array) statement。如:$ awk'{count[$1]++} END{for(name in count) print name,count[name]}' test。该语句将打印$1中字符串出现的次数。它首先以第一个域作数组count的下标,第一个域变化,索引就变化。
*
delete 函数用于删除数组元素。如:$ awk '{line[x++]=$1} END{for(x in line) delete(line[x])}' test。分配给数组line的是第一个域的值,所有记录处理完成后,special for循环将删除每一个元素。
awk的其他参数说明:
参照网站http://www.cnblogs.com/ggjucheng/archive/2013/01/13/2858470.html