linux下有许多对字符串文本的处理工具,diff,grep,awk,sed等等。。
diff
比较两个文件的不同
[root@bogon diff]# diff file1 file2
以高亮的形式在vim编辑器中显示两个文件的不同之处
vimdiff
grep
用于匹配字符,或者查找文件中的匹配项
[root@bogon diff]# ls | grep file
file1
file2
重要参数
-i #忽略大小写
-n #显示结果所在行的行号
-c #显示结果个数
-v #反向过滤
-r + 目录名 ###在目录下查找含有关键字的内容
-E "关键字1|关键字2" ###过滤多个关键字
sort
用于排序
-n #纯数字
-r #倒序显示
-u #去掉重复行
-t #指定分隔符
-k #指定排序的列
用法实例sort -t: -k3 -n /etc/passwd
将文本以:为分隔符,以第三列作为(uid)排序标准,-n表示排序是以纯数字来排,而不是以字母的顺序。
uniq
重复行处理,uniq只会认为连续的重复的行才是重复行。
若想删除掉所有的重复的行,可以先排序然后uniq
-c #统计重复行的个数
-d #显示重复行
-u #显示唯一行
tr
转换字符大小写tr 'a-z' A-Z < 文件名
##将所有的大写转换成大写tr -d 关键字 文件名
##将所有关键字删除
sed
sed 's/nologin/login/g' file #将file文件中的所有nologin替换成login
sed '1,5s/nologin/login/g' file #将1-5行的所有nologin换成login
sed '/games/,/nobody/s/nologin/login/g' file #将games到nobody之间的nologin换成login
sed -e 's/nologin/login/g' -e 's/sbin/bin/g' #多条替换规则一起用
sed 3d file #不显示第三行
sed 3,7d file #不显示3-7行
sed 3,7p file #重复显示3-7行
sed -n 3,7p file #只显示3-7行
touch rule #建立规则文件
sed -f rule file #使用规则文件更改输出
以上的操作均不会对原来的文本进行修改,若要修改,需要在前面加上-i
参数
awk
awk是一个超强的文本处理工具,甚至可以当做一个脚本语言来使用。这里只介绍一种常用的使用方式,那就是进行字符的分割。
以截取自己的局域网ip为例
[root@linux hexo]# ifconfig wlp1s0
wlp1s0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500
inet 192.168.1.103 netmask 255.255.255.0 broadcast 192.168.1.255
inet6 fe80::c6d9:87ff:fe5a:68f1 prefixlen 64 scopeid 0x20<link>
ether c4:d9:87:5a:68:f1 txqueuelen 1000 (Ethernet)
RX packets 313404 bytes 392626230 (374.4 MiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 213498 bytes 26747428 (25.5 MiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
[root@linux hexo]# ifconfig wlp1s0|grep -w "inet"
inet 192.168.1.103 netmask 255.255.255.0 broadcast 192.168.1.255
[root@linux hexo]# ifconfig wlp1s0|grep -w "inet"|awk -F" " '{print $2}'
192.168.1.103
awk 的主要用法 -F参数后面接分隔的字符" "
后面接'{ }' $1 $2..
分别代表分隔出来的每一列,print $1
就是输出这一列
这只是awk的一种用法而已,awk算得上一个脚本语言,有自己独立的语法,就不一一概述