文件及内容处理 - grep(egrep)、join
1. grep(egrep):文本过滤工具
grep(egrep)命令的功能说明
grep
命令是Linux
系统中最重要的命令之一,其功能是从文本文件或管道数据流中筛选匹配的行及数据,如果配合正则表达式技术一起使用,则功能更加强大。egrep
是grep
的扩展正则,后面讲三剑客时会讲的。grep命令的语法格式
grep
[OPTIONS] [-e PATTERN | -f FILE] [FILE...]grep
[-abcEFGhHilLnqrsvVwxy][-A<显示列数>][-B<显示列数>][-C<显示列数>][-d<进行动作>][-e<范本样式>][-f<范本文件>][--help][范本样式][文件或目录...]grep命令的常用参数说明:
grep
参数很多,表1为grep
命令的参数及说明:表1:
grep
命令的参数及说明
参数选项 | 解释说明 |
---|---|
-a 或 --text | 不要忽略二进制的数据。 |
-A<显示行数> 或 --after-context=<显示行数> | 除了显示符合范本样式的那一列之外,并显示该行之后的内容。 |
-b 或 --byte-offset | 在显示符合样式的那一行之前,标示出该行第一个字符的编号。 |
-B<显示行数> 或 --before-context=<显示行数> | 除了显示符合样式的那一行之外,并显示该行之前的内容。 |
-c 或 --count | 计算符合样式的列数。 |
-C<显示行数> 或 --context=<显示行数>或-<显示行数> | 除了显示符合样式的那一行之外,并显示该行之前后的内容。 |
-d <动作> 或 --directories=<动作> | 当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。 |
-e<范本样式> 或 --regexp=<范本样式> | 指定字符串做为查找文件内容的样式。 |
-E 或 --extended-regexp | 将样式为延伸的普通表示法来使用。 |
-f<规则文件> 或 --file=<规则文件> | 指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。 |
-F 或 --fixed-regexp | 将样式视为固定字符串的列表。 |
-G 或 --basic-regexp | 将样式视为普通的表示法来使用。 |
-h 或 --no-filename | 在显示符合样式的那一行之前,不标示该行所属的文件名称。 |
-H 或 --with-filename | 在显示符合样式的那一行之前,表示该行所属的文件名称。 |
-i 或 --ignore-case | 忽略字符大小写的差别。 |
-l 或 --file-with-matches | 列出文件内容符合指定的样式的文件名称。 |
-L 或 --files-without-match | 列出文件内容不符合指定的样式的文件名称。 |
-n 或 --line-number | 在显示符合样式的那一行之前,标示出该行的列数编号。 |
-o 或 --only-matching | 只显示匹配PATTERN 部分。 |
-q 或 --quiet或--silent | 不显示任何信息。 |
-r 或 --recursive | 此参数的效果和指定"-d recurse"参数相同。 |
-s 或 --no-messages | 不显示错误信息。 |
-v 或 --revert-match | 显示不包含匹配文本的所有行。 |
-V 或 --version | 显示版本信息。 |
-w 或 --word-regexp | 只显示全字符合的列。 |
-x --line-regexp | 只显示全列符合的列。 |
-y | 此参数的效果和指定"-i"参数相同。 |
grep命令的实践操作
范例1:
–v
参数实践[root@oldboyedu ~]#cat 1.txt 1 2 3 [root@oldboyedu ~]# grep -v "2" 1.txt 1 3 [root@oldboyedu ~]#
范例2:
-n
参数实践[root@oldboyedu ~]# cat 2.txt aa aa bb cc dd ee ff bb cc dd ee ff [root@oldboyedu ~]# grep -n "cc" 2.txt 4:cc 9:cc [root@oldboyedu ~]#
范例3:
-i
参数实践[root@oldboyedu ~]# cat 3.txt aa bb cc Ab Ba cA bC [root@oldboyedu ~]# grep "c" 3.txt cc cA [root@oldboyedu ~]# grep -i "c" 3.txt cc cA bC [root@oldboyedu ~]#
范例4:
-E'
和--color'
的参数实践[root@oldboyedu ~]# cat 3.txt aa bb cc Ab Ba cA bC [root@oldboyedu ~]# grep -Ei "a|c" 3.txt aa cc Ab Ba cA bC [root@oldboyedu ~]# grep -Ei --color=auto "a|c" 3.txt aa cc Ab Ba cA bC [root@oldboyedu ~]#
范例5:
-c
参数实战[root@oldboyedu ~]# cat 3.txt aa bb cc Ab Ba cA bC [root@oldboyedu ~]# grep -c "c" 3.txt 2 [root@oldboyedu ~]#
范例6:
-o
参数实战[root@oldboyedu ~]# cat 3.txt aa bb cc Ab Ba cA bC [root@oldboyedu ~]# grep -o "c" 3.txt c c c [root@oldboyedu ~]#
2. join:按两个文件的相同字段合并
join命令的功能说明
join
命令用于将两个文件中,指定栏位内容相同的行连接起来。找出两个文件中,指定栏位内容相同的行,并加以合并,再输出到标准输出设备。join命令的语法格式
join
[OPTION]... FILE1 FILE2join
[-i][-a<1或2>][-e<字符串>][-o<格式>][-t<字符>][-v<1或2>][-1<栏位>][-2<栏位>][--help][--version][文件1][文件2]join命令的常用参数说明:
join
参数,表1为join
命令的参数及说明:表1:
join
命令的参数及说明
参数选项 | 解释说明 |
---|---|
-a<1或2> | 除了显示原来的输出内容之外,还显示指令文件中没有相同栏位的行。 |
-e<字符串> | 若[文件1]与[文件2]中找不到指定的栏位,则在输出中填入选项中的字符串。 |
-i或--igore-case | 比较栏位内容时,忽略大小写的差异。 |
-o<格式> | 按照指定的格式来显示结果。 |
-t<字符> | 使用栏位的分隔字符。 |
-v<1或2> | 跟-a相同,但是只显示文件中没有相同栏位的行。 |
-1<栏位> | 连接[文件1]指定的栏位。 |
-2<栏位> | 连接[文件2]指定的栏位。 |
--help | 显示帮助。 |
--version | 显示版本信息。 |
join命令的实践操作
范例1: 连接两个文件。
--------------------------------------------------------------
==>首先查看 testfile_1、testfile_2 中的文件内容<==
--------------------------------------------------------------
[root@oldboyedu ~]# cat testfile_1
Hello 95
Linux 85
test 30
[root@oldboyedu ~]# cat testfile_2
Hello 2005
Linux 2009
test 2006
--------------------------------------------------------------
==>然后使用join命令,将两个文件连接<==
--------------------------------------------------------------
[root@oldboyedu ~]# join testfile_1 testfile_2
Hello 95 2005
Linux 85 2009
test 30 2006
--------------------------------------------------------------
==>文件1与文件2的位置对输出到标准输出的结果是有影响的<==
--------------------------------------------------------------
[root@oldboyedu ~]# join testfile_2 testfile_1
Hello 2005 95
Linux 2009 85
test 2006 30
今天就写到这里,有什么疑问或出现什么错误,随时欢迎大神们发表评论指点迷津