linux grep命令详解


1.作用

linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。

2.语法格式

grep [OPTION]...PATTERN [FILE] ...

3.主要参数

[options]主要参数:

-c:只输出匹配了多少次。

-i:不区分大小写(只适用于单字符)。

-h:查询多文件时不显示文件名。

-l:查询多文件时只输出包含匹配字符的文件名。

-n:显示匹配行及行号。

-s:不显示不存在或无匹配文本的错误信息。

-v:显示不包含匹配文本的所有行。

-d:跳过对子目录的搜索

-r: 对子目录也进行查找


4.grep正则表达式元字符集(基本集):

\:忽略正则表达式中特殊字符的原有含义。

^:匹配正则表达式的开始行,如:'^grep'匹配所有以grep开头的行。

$:  匹配正则表达式的结束行,如'grep$'匹配所有以grep结尾的行。

\<:从匹配正则表达式的行开始。如'\<grep'匹配包含以grep结尾的单词的行。

\>:到匹配正则表达式的行结束。如'grep\>'匹配包含以grep结尾的单词的行。

[]:匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep。需要特別留意的是,在 [] 当中『仅代表一个待搜寻的字元』

[ n1-n2 ]:范围,如[A-Z],即A、B、C一直到Z都符合要求 。

. :所有的单个字符。

* :有字符,长度可以为0。

\(..\):标记匹配字符,如'(love)',love被标记为1。

\{n,m\}:意義:重复前一个字符n-m个,若为\{n\}则是重复前一个字符n次,若是 \{n,\}则是重复前一个字答n次以上


5.用于egrep grep -E的元字符(扩展集)

+      匹配一个或多个先前的字符。如:'[a-z]+able',匹配一个或多个小写字母后跟able的串,如loveable,enable,disable等。

?      匹配零个或多个先前的字符。如:'gr?p'匹配gr后跟一个或没有字符,然后是p的行。

a|b|c  匹配a或b或c。如:grep|sed匹配grep或sed

()     分组符号,如:love(able|rs)ov+匹配loveable或lovers,匹配一个或多个ov。


6.举例

参数不举例了,见名思义,下面主要练习正则表达式


1)正则表达式的运用(过滤出本机IP地址)

[root@yang1 lesson-1]# ifconfig eth0|grep 'inetaddr:'|sed 's/^.*addr:\([0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\)  Bcast.*/\1/g'

10.0.0.29

解析:^.*           以任意字符开头,并重复0次或多次

[0-9]\{1,3\}  重复匹配0-9中的字符1次或2次或3次

\( ……\)    标记匹配字符,第一个\(\)标记为1,第二个\(\)标记为2

     \1           取第1个标记中的内容

s/aa/b/g    属于sed中的替换功能,把aa替换为b,例中把匹配的一行替换为标记1中的内容



2)egrep扩展表达式运用

过滤出多个行要使用egrep

[root@yang1lesson-1]# ifconfig eth0|grep 'inet|inet6'

[root@yang1lesson-1]# ifconfig eth0|egrep 'inet|inet6'

         inet addr:10.0.0.29  Bcast:10.0.0.255  Mask:255.255.255.0

         inet6 addr:fe80::20c:29ff:fe6a:4121/64 Scope:Link

其它+? ()同理,需要使用egrep或grep -E






上一篇:计算几何--判断两条线段相交--poj 2653


下一篇:python dict字典操作用法详细总结