1.作用
linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。
2.语法格式
grep [OPTION]...PATTERN [FILE] ...
3.主要参数
[options]主要参数:
-c:只输出匹配了多少次。
-i:不区分大小写(只适用于单字符)。
-h:查询多文件时不显示文件名。
-l:查询多文件时只输出包含匹配字符的文件名。
-n:显示匹配行及行号。
-s:不显示不存在或无匹配文本的错误信息。
-v:显示不包含匹配文本的所有行。
-d:跳过对子目录的搜索
-r: 对子目录也进行查找
4.grep正则表达式元字符集(基本集):
\:忽略正则表达式中特殊字符的原有含义。
^:匹配正则表达式的开始行,如:'^grep'匹配所有以grep开头的行。
$: 匹配正则表达式的结束行,如'grep$'匹配所有以grep结尾的行。
\<:从匹配正则表达式的行开始。如'\<grep'匹配包含以grep结尾的单词的行。
\>:到匹配正则表达式的行结束。如'grep\>'匹配包含以grep结尾的单词的行。
[]:匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep。需要特別留意的是,在 [] 当中『仅代表一个待搜寻的字元』
[ n1-n2 ]:范围,如[A-Z],即A、B、C一直到Z都符合要求 。
. :所有的单个字符。
* :有字符,长度可以为0。
\(..\):标记匹配字符,如'(love)',love被标记为1。
\{n,m\}:意義:重复前一个字符n-m个,若为\{n\}则是重复前一个字符n次,若是 \{n,\}则是重复前一个字答n次以上
5.用于egrep和 grep -E的元字符(扩展集)
+ 匹配一个或多个先前的字符。如:'[a-z]+able',匹配一个或多个小写字母后跟able的串,如loveable,enable,disable等。
? 匹配零个或多个先前的字符。如:'gr?p'匹配gr后跟一个或没有字符,然后是p的行。
a|b|c 匹配a或b或c。如:grep|sed匹配grep或sed
() 分组符号,如:love(able|rs)ov+匹配loveable或lovers,匹配一个或多个ov。
6.举例
参数不举例了,见名思义,下面主要练习正则表达式
1)正则表达式的运用(过滤出本机IP地址)
[root@yang1 lesson-1]# ifconfig eth0|grep 'inetaddr:'|sed 's/^.*addr:\([0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\) Bcast.*/\1/g'
10.0.0.29
解析:^.* 以任意字符开头,并重复0次或多次
[0-9]\{1,3\} 重复匹配0-9中的字符1次或2次或3次
\( ……\) 标记匹配字符,第一个\(\)标记为1,第二个\(\)标记为2
\1 取第1个标记中的内容
s/aa/b/g 属于sed中的替换功能,把aa替换为b,例中把匹配的一行替换为标记1中的内容
2)egrep扩展表达式运用
过滤出多个行要使用egrep
[root@yang1lesson-1]# ifconfig eth0|grep 'inet|inet6'
[root@yang1lesson-1]# ifconfig eth0|egrep 'inet|inet6'
inet addr:10.0.0.29 Bcast:10.0.0.255 Mask:255.255.255.0
inet6 addr:fe80::20c:29ff:fe6a:4121/64 Scope:Link
其它+? ()同理,需要使用egrep或grep -E