Linux grep命令和正则表达式

介绍

grep是一个功能强大的文本搜索命令,可以用它来搜索某个文件中是否包含指定的搜索内容,它可以利用正则表达式来做复杂的筛选操作,它还可以为其它命令传输给管道的筛选,比如我们常用到的分析单个进程的操作就是会利用它“ps -ef|grep command”。

 

语法

grep [OPTION]... PATTERN [FILE]...

默认不加参数是显示匹配上的行记录,可以使用--help来查看它所支持的所以参数,本文只会列举比较常用的一些命令。

Linux grep命令和正则表达式
-a:输出的内容不要忽略二进制数据
-b<n>:输出匹配上的n个字节的行。
-c :只显示符合条件的行的数量,不显示内容
-d:当你要查找的是目录而不是文件的时候需要制定该参数,否则会报错
-H:在输出的内容行前加上该行所属的文件名。
-h:不在输出的行前加上该行所属的文件名,这是默认的选项。
-i:忽略大小写
-L:列出不符合查找内容的文件的文件名
-l:列出符合查找内容的文件的文件名
-m<n>:只输出匹配上的指定n行。
-o:只显示查找的内容,不显示该行其它的内容。
-q:什么都不输出
-r:如果需要遍历整个目录的所有文件,可以使用该参数
-v:显示没有匹配上的行信息,和默认值相反
-V:显示版本信息
Linux grep命令和正则表达式

正则表达式

grep配合正则进行筛选的时候对于{ } ()都需要用到转义字符。

命令

说明

^

在字符的开启处进行匹配

$

在字符的末尾处进行匹配

.

匹配任何字符(包括回车和新行)

[….]

匹配括号内的任意单个字符

[m-n]

匹配m到n之间的任意单个字符,例如[0-9],[a-z],[A-Z]

[^..]

不能匹配括号内的任意单个字符

a*

匹配0个或多个a,包括空

a\{m\}

匹配m个a

a\{m,\}

匹配m个或者更多个a

a\{m,n\}

匹配m到n个a

\(….\)

将模式元素组成单一元素,例如(do)*意思是匹配0个多或多个do

 

grep常见用法

创建测试数据

grep --help >/tmp/grep.text

1.为其它命令做筛选操作

Linux grep命令和正则表达式
查询包含sbin的进程

[root@localhost ~]# ps -ef |grep "sbin"
root 1 0 0 11:04 ? 00:00:01 /sbin/init
root 543 1 0 11:04 ? 00:00:00 /sbin/udevd -d
root 1559 1 0 11:04 ? 00:00:00 /usr/sbin/vmware-vmblock-fuse -o subtype=vmware-vmblock,default_permissions,allow_other /var/run/vmblock-fuse
root 1580 1 0 11:04 ? 00:00:18 /usr/sbin/vmtoolsd
root 1992 1 0 11:04 ? 00:00:00 /sbin/rsyslogd -i /var/run/syslogd.pid -c 5
root 2078 1 0 11:04 ? 00:00:00 /usr/sbin/modem-manager
root 2122 1 0 11:04 ? 00:00:00 /usr/sbin/wpa_supplicant -c /etc/wpa_supplicant/wpa_supplicant.conf -B -u -f /var/log/wpa_supplicant.log -P /var/run/wpa_supplicant.pid
root 2133 1 0 11:05 ? 00:00:00 /usr/sbin/acpid
root 2219 1 0 11:05 ? 00:00:00 /usr/sbin/bluetoothd --udev
root 2298 1 0 11:05 ? 00:00:00 /usr/sbin/sshd
root 3172 1 0 11:05 ? 00:00:00 /usr/sbin/abrtd
root 3199 1 0 11:05 ? 00:00:00 /usr/sbin/atd
root 3215 1 0 11:05 ? 00:00:00 /usr/sbin/gdm-binary -nodaemon
root 3220 1 0 11:05 tty2 00:00:00 /sbin/mingetty /dev/tty2
root 3222 1 0 11:05 tty3 00:00:00 /sbin/mingetty /dev/tty3
root 3224 1 0 11:05 tty4 00:00:00 /sbin/mingetty /dev/tty4
root 3227 543 0 11:05 ? 00:00:00 /sbin/udevd -d
root 3228 1 0 11:05 tty5 00:00:00 /sbin/mingetty /dev/tty5
root 3230 1 0 11:05 tty6 00:00:00 /sbin/mingetty /dev/tty6
root 3231 543 0 11:05 ? 00:00:00 /sbin/udevd -d
root 3261 1 0 11:05 ? 00:00:00 /usr/sbin/console-kit-daemon --no-daemon
root 5923 2071 0 14:12 ? 00:00:00 /sbin/dhclient -d -4 -sf /usr/libexec/nm-dhcp-client.action -pf /var/run/dhclient-eth0.pid -lf /var/lib/dhclient/dhclient-3a7ff4d9-5a09-46b1-bb20-0298a18e6b78-eth0.lease -cf /var/run/nm-dhclient-eth0.conf eth0
root 6294 6044 0 15:50 pts/1 00:00:00 grep sbin

Linux grep命令和正则表达式

2. 查询行数

查询包含“-d”的行数
[root@localhost ~]# grep -c "\-d" /tmp/grep.txt 
6

3.$

查询以lines结尾的行

[root@localhost ~]# grep  "lines$" /tmp/grep.txt 
  -x, --line-regexp         force PATTERN to match only whole lines
  -v, --invert-match        select non-matching lines
  -b, --byte-offset         print the byte offset with output lines
  -n, --line-number         print line number with output lines

4.{m,}

Linux grep命令和正则表达式
查询包含2个或者更多个S的行
[root@localhost ~]# grep  "\(s\)\{2,\}" /tmp/grep.txt 
PATTERN is, by default, a basic regular expression (BRE).
  -E, --extended-regexp     PATTERN is an extended regular expression (ERE)
  -G, --basic-regexp        PATTERN is a basic regular expression (BRE)
  -P, --perl-regexp         PATTERN is a Perl regular expression
  -s, --no-messages         suppress error messages
  -h, --no-filename         suppress the file name prefix on output
  -q, --quiet, --silent     suppress all normal output
      --binary-files=TYPE   assume that binary files are TYPE;
-r is given, - otherwise.  If fewer than two FILEs are given, assume -h.
Linux grep命令和正则表达式

总结

注意使用转义字符,如果使用正则要查找的不是单个字符而是多个字符需要使用()把多个字符括起来,grep还有很多的使用技巧这里就不一一列出来。

 

 





本文转自pursuer.chen(陈敏华)博客园博客,原文链接:http://www.cnblogs.com/chenmh/p/5342456.html,如需转载请自行联系原作者

上一篇:Spark Streaming Direct Approach (No Receivers) 分析


下一篇:全球网络安全风险分析平台Bay Dynamics获得2300万美元融资