SHELL——通配符，IO重定向，正则表达式

2021-07-07 10:40:50

一。正则表达式：

元字符是用来阐释字符表达式意义的字符，简言之，就是用来描述字符的字符。

正则表达式RE（Regular Expression）是由一串字符和元字符构成的字符串。

正则表达式的主要功能是文本查询和字符串操作，它可以匹配文本的一个字符或字符集合。实际上正则表达式完成了数据的过滤，将不满足正则表达式定义的数据拒绝掉，剩下与正则表达式匹配的数据。

1.正则表达式的组成

(1).一般字符：没有特殊意义的字符

(2).特殊字符（meta字符）：元字符，有在正则表达式中有特殊意义

2.如下讲下正则表达式中的常见meta字符

(1).POSIX BRE与ERE中都有的meta字符:

\ : 通常用于打开或关闭后续字符的特殊含义，如$...$与\{...\}

. : 匹配任何单个字符（除NUL）

* : 匹配其前的任何数目或没有的单个字符，例： . 表示任一字符，则 .* 匹配任一字符的任意长度

^ : 匹配紧接着的正则表达式，BRE中仅在正则表达式的开头有特殊的含义，ERE中在任何位置都有特殊含义

$ : 匹配前面的正则表达式，在字符串或者行结尾处。BRE中仅在正则表达式的结尾处有特殊的含义，ERE中在任何位置都有特殊含义

[] : 匹配方括号内的任一字符，其中可用连字符（-）指的连续字符的范围；^符号苦出现在方括号的第一个位置，则表示匹配不在列表中的任一字符，

(2).POSIX BRE中才有的字符：

\{n,m\} : 区间表达式，匹配在它前面的单个字符重现的次数区别。\{n\}指重现n次;\{n,m\}指重现n至m次;

 : 保留空间，可以将最多9个独立的子模式存储在单个模式中。如$ab$.*\1 : 指匹配ab组合的两次重现，中间可存在任意数目的字符。

\n : 重复在$与$方括号内第n个子模式至此点的模式。

(3).POSIX ERE中才有的字符：

{n,m} : 与BRE的\{n,m\}功能相同

+ : 匹配前面正则表达式的一个或多个扩展

? : 匹配前面正则表达式的零个或一个扩展

| : 匹配|符号前或后的正则表达式

( ) : 匹配方括号括起来的正则表达式群

(4). 方括号（[]）表达式

4.1.字符集 [: :]

标识字符集，有如下几种：

[::alnum] : 数字字符	[:digit:] : 数字字符	[:punct:] : 标点符号字符
[:alpha:] : 字母字符	[:graph:] : 非空格字符	[:space:] : 空格字符
[:blank:] : 空格与定位字符	[:lower:] : 小写字母字符	[:upper:] : 大写字母字符
[:cntrl:] : 控制字符	[:print:] : 可显示的字符	[:xdigit:] : 16进制数字

二。通配符

bash shell本身不支持正则表达式，使用正则表达式的是shell命令和工具，如grep，sed，awk。

bash shell可以使用正则表达式中的一些元字符实现通配（Globbing）功能。

通配是把一个包含通配符的非具体文件名扩展存储在计算机，服务器或者网络上的一批具体文件名的过程。（可以看出通配主要应用匹配文件名上，而正则主要应用于字符串上）

* - 通配符,代表任意字符(0到多个)
? - 通配符,代表一个字符
# - 注释
/ - 跳转符号,将特殊字符或通配符还原成一般符号
| - 分隔两个管线命令的界定
; - 连续性命令的界定
~ - 用户的根目录
$ - 变量前需要加的变量值
! - 逻辑运算中的"非"(not)
/ - 路径分隔符号
>, >> - 输出导向,分别为"取代"与"累加"
' - 单引号,不具有变量置换功能
" - 双引号,具有变量置换功能
` - quote符号,两个``中间为可以先执行的指令
() - 中间为子shell的起始与结束
[] - 中间为字符组合
{} - 中间为命令区块组合
Ctrl+C - 终止当前命令
Ctrl+D - 输入结束(EOF),例如邮件结束的时候
Ctrl+M - 就是Enter
Ctrl+S - 暂停屏幕的输出
Ctrl+Q - 恢复屏幕的输出
Ctrl+U - 在提示符下,将整行命令删除
Ctrl+Z - 暂停当前命令
&& - 当前一个指令执行成功时,执行后一个指令
|| - 当前一个指令执行失败时,执行后一个指令

三。IO重定向

在我们设置定时任务的时候经常会使用标准输出和标准错误输出。这个在Linux是一个非常重要的概念，而且这个很有用。程序应该有数据库的来源端、数据的目的端，以及报告问题的地方，它们被称为标准输入、标准输出以及标准错误输出。

重定向与管道

Shell提供了数种语法，可以修改默认的IO的来源端和目的端，就是标准输入和输出的地方。

<	修改标准输入	sort < ucid.txt	默认下，标准输入为终端，此时可以更改为你想要的地方
<<		Command << delimiter	从标准输入中读入，直到遇到delimiter分割符
>	修改标准输出	ls -l > listinfo.txt	默认下，标准输出为终端，此时可以修改默认输出的地方。譬如可以将标准输出的内容写在文件中。如果文件已存在，会被覆盖掉。
>>	输出附件到文件	ls -l >> listinfo.txt	与[>]不一样的是，[>]会清空原来的内容，而[>>]只是将标准输出追加到文件结尾处。
\|	建立管道	program1 \| program2	1. program1的标准输出为program2的标准输入； 2. 管道的执行效率比使用临时文件的程序起码高一个数量级；

文件描述符

在定时任务，我们经常在重定向的时候，喜欢这样操作。

33 1 * * * /home/weiyg/crontab/clear_logs.sh > /dev/null 2>&1

后面的 2>&1是什么意思呢，这里就要理解文件描述符和绑定重定向的概念了。

文件	文件描述符
输入文件——标准输入	0（默认为终端（网上有说默认为键盘的））
输出文件——标准输出	1（默认为终端）
错误输出文件——标准错误	2（默认为终端）

绑定重定向

Commond >&m	标准输出重定向到文件描述符m中
Command <&-	关闭标准输入
Command 0>&-	关闭标准输出

本文转自willis_sun 51CTO博客，原文链接：http://blog.51cto.com/willis/1846590，如需转载请自行联系原作者

码农公寓

一。正则表达式：

相关文章