Linux入门-7 Linux管道、重定向以及文本处理

Linux管道、重定向以及文本处理

开源的一个重要理念:不要重复发明*
很多开源软件都是现有软件、代码、功能的重新组合。
《大教堂与集市》

1 Linux多命令协作:管道及重定向

管道和重定向

Linux中,大多数命令都很简单,往往只实现一个或几个简单的功能,我们可以将不同功能的命令组合在一起使用,以达到完成某个复杂功能的目的。
Linux中,几乎所有命令的返回都是纯文本的,而纯文本形式的数据是绝大多数命令的输入格式,这就让协作成为可能。
Linux的命令行为我们提供了管道和重定向机制,多命令协作就是通过管道和重定向完成的。

  • 命令行shell数据流有以下定义:
名称 说明 编号 默认
STDIN 标准输入 0 键盘
STDOUT 标准输出 1 终端
STDERR 标准错误 2 终端

命令通过STDIN接收参数或数据,通过STDOUT输出结果或通过STDERR输出错误。

  • 通过管道和重定向可以控制CLI的数据流
  • 管道通常用来组合不同的命令,以实现更复杂的功能
  • 重定向通常用来保存命令的输出或错误信息
分类 关键字 定义 例子
重定向 > 将STDOUT重定向到文件(覆盖) echo "linuxcast.net" > outfile
重定向 >> 将STDOUT重定向到文件(追加) echo "linuxcast.net" >> outfile
重定向 2> 将STDERR重定向到文件(覆盖) echo "linuxcast.net" 2> outfile
重定向 2>&1 将STDERR与STDOUT结合 echo "linuxcast.net" 2>&1 outfile
重定向 < STDIN grep linuxcast < /etc/passwd
管道 | 将一个命令的STDOUT作为另一个命令的STDIN ls -l | grep linuxcast

一个更复杂的例子:查找用户linuxcast的Video文件,将查找错误重定向到null(丢弃)
find / -user linuxcast 2> /dev/null | grep Video

2 Linux命令行文本处理工具

文件浏览

  • cat/more/less/head/tail

基于关键字搜索-grep

该命令使用正则表达式搜索指定的纯文本文件或纯文本(管道)

  • -i 忽略大小写
  • -n 现实结果所在行数(文件)
  • -v 输出不带关键字的行(反选)
  • -Ax 输出的时候包含结果所在行之后的指定行数
  • -Bx 输出的时候包含结果所在行之前的指定行数

基于列处理文本-cut

  • -d 指定分割字符,默认为TAB
  • -f 指定输出的列号
  • -c 基于字符进行切割,固定长度

例:
cut -d: -f1 /etc/passwd:为分割符,显示第一列
grep linuxcast /etc/passwd | cut -d: -f3输出用户linuxcast的uid(第三列)
cut -c2-6 /etc/passwd第2-6个字符

文本统计-wc

  • -l 只统计行数line
  • -w 只统计单词word
  • -c 只统计字节数
  • -m 只统计字符数

文本排序-sort

  • -r 进行倒叙排序
  • -n 基于数字进行排序
  • -f 忽略大小写
  • -u 删除重复行
  • -tc 使用c作为分隔符分割为列进行排序
  • -kx 当进行基于指定字符分割为列的排序时,指定基于哪个列排序

删除重复行

  • sort -u 排序时删除重复行
  • uniq 删除重复的相邻行

文本比较-diff

  • -i 忽略大小写
  • -b 忽略空格数量的改变
  • -u 统一显示比较信息(一般用以生成patch文件)
    diff -u linuxcast linuxcast-new > final.patch

检查拼写-aspell

  • aspell check linuxcast
  • aspell list < linuxcast

处理文本内容-tr

translate

  • tr -d 'TMD' < linuxcast 删除关键字
  • tr 'a-z' 'A-Z' < linuxcast 转换大小写

搜索替换-sed

使用正则表达式处理文本文件

  • sed 's/linux/unix/g' linuxcast 替换linux为unix,/g全部替换
  • sed '1,50s/linux/unix/g' linuxcast 替换1-50行
  • sed -e 's/linux/unix/g' -e 's/nash/nash_su/g' linuxcast 多个正则表达式
  • sed -f sededit linuxcast 将匹配表达式保存在sededit文件中
上一篇:linux文件管理之管道与重定向


下一篇:linux 管道与重定向