linux文本处理命令
1、wc命令
基本介绍
文件的行统计、字符统计、字节统计
基本语法
wc [OPTION]... [FILE]...
wc [OPTION]... --files0-from=F
常用选项
-c:打印字节数
-m:打印字符数
-l:打印行数
-w:打印单词数
--help:获取命令帮助
使用案例
[root@oldboy ~]# [root@oldboy ~]# wc -l /etc/fstab 15 /etc/fstab [root@oldboy ~]# wc -c /etc/fstab 781 /etc/fstab [root@oldboy ~]# wc -w /etc/fstab 78 /etc/fstab [root@oldboy ~]# wc -m /etc/fstab 781 /etc/fstab
2、cut命令
基本介绍
切除某一个区域
基本语法
cut OPTION... [FILE]...
常用选项
-d:指定分割符
使用规则
cut -d 分割符
-f:指定显示第几个字段
使用规则
cut -f num:表示显示第num个字段
cut -f num1,num3:表示显示离散的几个字段,比如1,4
cut -f num1-num3:表示显示连续的几个字段,比如1-3
cut -f num1-num3,num6:表示显示1-3连续字段,在显示6字段。混合使用
--output-delimiter=STRING:指定STRING字符作为输出的分隔符,也就是将原本切割的分割符换成这个指定的STRING作为分隔符
使用注意
cut命令如果没有指定-d选项,那么默认使用空白字符作为切割
3、sort命令
基本介绍
对文件的文本进行排序
基本语法
sort [OPTION]... [FILE]...
sort [OPTION]... --files0-from=F
常用选项
-f:忽略字符的大小写
-r:逆序
-t:指明分割符
使用方式
sort -t 分割符 文件路径
-k:指定排序的字段
使用方式
sort -t 分割符 -k 排序的字段num 文件路径
案例演示
sort -t : -k 2 /etc/passwd
-n:以数字进行排序
-u:排序后去重,英文名uniq
这个选项要先排序然后再去掉重复的
-o:排序后输出到文件中
使用注意
sort命令默认排序方式是字符对应在ASCII的大小对应来进行排序,如果要对数字进行排序,使用-n选项
4、uniq命令
基本介绍
连续且完全相同则为重复
基本语法
uniq [OPTION]... [INPUT [OUTPUT]]
常用选项
-c:显示每行重复出现的次数
-d:仅显示重复出现过的行,至少出现两次
-u:仅显示不曾出现重复的行,即只出现一次的行
使用注意
uniq命令默认是不进行排序,那么进行去重操作是会出现诡异现象,就是还存在相同的项,这是因为,uniq默认不进行排序,只会检查两个连续挨在一起的是否重复,重复则去掉一个
未完,待续...