linux文本处理命令

2022-12-03 08:08:01

linux文本处理命令

1、wc命令

基本介绍

　　文件的行统计、字符统计、字节统计

基本语法

wc [OPTION]... [FILE]...

wc [OPTION]... --files0-from=F

常用选项

　　-c：打印字节数

　　-m：打印字符数

　　-l：打印行数

　　-w：打印单词数

　　--help：获取命令帮助

使用案例

[root@oldboy ~]#

[root@oldboy ~]# wc -l /etc/fstab

15 /etc/fstab

[root@oldboy ~]# wc -c /etc/fstab

781 /etc/fstab

[root@oldboy ~]# wc -w /etc/fstab

78 /etc/fstab

[root@oldboy ~]# wc -m /etc/fstab

781 /etc/fstab

2、cut命令

基本介绍

　　切除某一个区域

基本语法

　　cut OPTION... [FILE]...

常用选项

　　-d：指定分割符

　　　　使用规则

　　　　　　cut -d 分割符

　　-f：指定显示第几个字段

　　　　使用规则

　　　　　　cut -f num：表示显示第num个字段

　　　　　　cut -f num1,num3：表示显示离散的几个字段，比如1,4

　　　　　　cut -f num1-num3：表示显示连续的几个字段，比如1-3

　　　　　　cut -f num1-num3,num6：表示显示1-3连续字段，在显示6字段。混合使用

　　　--output-delimiter=STRING：指定STRING字符作为输出的分隔符，也就是将原本切割的分割符换成这个指定的STRING作为分隔符

使用注意

　　cut命令如果没有指定-d选项，那么默认使用空白字符作为切割

3、sort命令

基本介绍

　　对文件的文本进行排序

基本语法

　　sort [OPTION]... [FILE]...

　　 sort [OPTION]... --files0-from=F

常用选项

　　-f：忽略字符的大小写

　　-r：逆序

　　-t：指明分割符

　　　　使用方式

　　　　　　sort -t 分割符文件路径

　　-k：指定排序的字段

　　　　使用方式

　　　　　　sort -t 分割符 -k 排序的字段num 文件路径

　　　　案例演示

　　　　　　sort -t : -k 2 /etc/passwd

　　-n：以数字进行排序

　　-u：排序后去重，英文名uniq

　　　　这个选项要先排序然后再去掉重复的

　　-o：排序后输出到文件中

使用注意

　　sort命令默认排序方式是字符对应在ASCII的大小对应来进行排序，如果要对数字进行排序，使用-n选项

4、uniq命令

基本介绍

　　连续且完全相同则为重复

基本语法

　　 uniq [OPTION]... [INPUT [OUTPUT]]

常用选项

　　-c：显示每行重复出现的次数

　　-d：仅显示重复出现过的行，至少出现两次

　　-u：仅显示不曾出现重复的行，即只出现一次的行

使用注意

　　uniq命令默认是不进行排序，那么进行去重操作是会出现诡异现象，就是还存在相同的项，这是因为，uniq默认不进行排序，只会检查两个连续挨在一起的是否重复，重复则去掉一个

未完，待续...

码农公寓

linux文本处理命令

1、wc命令

2、cut命令

3、sort命令

4、uniq命令

相关文章