linux文本处理命令

linux文本处理命令

1、wc命令

基本介绍

  文件的行统计、字符统计、字节统计

基本语法

wc  [OPTION]...  [FILE]...

wc  [OPTION]...  --files0-from=F

常用选项

  -c:打印字节数

  -m:打印字符数

  -l:打印行数

  -w:打印单词数

  --help:获取命令帮助

使用案例

[root@oldboy ~]#

[root@oldboy ~]# wc -l /etc/fstab

15 /etc/fstab

[root@oldboy ~]# wc -c /etc/fstab

781 /etc/fstab

[root@oldboy ~]# wc -w /etc/fstab

78 /etc/fstab

[root@oldboy ~]# wc -m /etc/fstab

781 /etc/fstab

  

2、cut命令

基本介绍

  切除某一个区域

基本语法

  cut  OPTION...  [FILE]...

常用选项

  -d:指定分割符

    使用规则

      cut  -d 分割符

  -f:指定显示第几个字段

    使用规则

      cut  -f num:表示显示第num个字段

      cut  -f  num1,num3:表示显示离散的几个字段,比如1,4

      cut  -f  num1-num3:表示显示连续的几个字段,比如1-3

      cut  -f  num1-num3,num6:表示显示1-3连续字段,在显示6字段。混合使用

   --output-delimiter=STRING:指定STRING字符作为输出的分隔符,也就是将原本切割的分割符换成这个指定的STRING作为分隔符

使用注意

  cut命令如果没有指定-d选项,那么默认使用空白字符作为切割

3、sort命令

基本介绍

  对文件的文本进行排序

基本语法

  sort [OPTION]... [FILE]...

   sort [OPTION]... --files0-from=F

常用选项

  -f:忽略字符的大小写

  -r:逆序

  -t:指明分割符

    使用方式

      sort  -t  分割符  文件路径

  -k:指定排序的字段

    使用方式

      sort  -t 分割符  -k 排序的字段num  文件路径

    案例演示

      sort  -t  :  -k 2  /etc/passwd

  -n:以数字进行排序

  -u:排序后去重,英文名uniq

    这个选项要先排序然后再去掉重复的

  -o:排序后输出到文件中

使用注意

  sort命令默认排序方式是字符对应在ASCII的大小对应来进行排序,如果要对数字进行排序,使用-n选项

4、uniq命令

基本介绍

  连续且完全相同则为重复

基本语法

   uniq  [OPTION]...  [INPUT [OUTPUT]]

常用选项

  -c:显示每行重复出现的次数

  -d:仅显示重复出现过的行,至少出现两次

  -u:仅显示不曾出现重复的行,即只出现一次的行

使用注意

  uniq命令默认是不进行排序,那么进行去重操作是会出现诡异现象,就是还存在相同的项,这是因为,uniq默认不进行排序,只会检查两个连续挨在一起的是否重复,重复则去掉一个

未完,待续...

上一篇:4. 案例-使用 Statement 完成 JDBC 增删改查


下一篇:基于Microchip单片机的触摸感应技术