SHELL——通配符,IO重定向,正则表达式

一。正则表达式:

        元字符是用来阐释字符表达式意义的字符,简言之,就是用来描述字符的字符。

        正则表达式RE(Regular Expression)是由一串字符和元字符构成的字符串。

        正则表达式的主要功能是文本查询和字符串操作,它可以匹配文本的一个字符或字符集合。实际上正则表达式完成了数据的过滤,将不满足正则表达式定义的数据拒绝掉,剩下与正则表达式匹配的数据。


1.正则表达式的组成

(1).一般字符:没有特殊意义的字符

(2).特殊字符(meta字符):元字符,有在正则表达式中有特殊意义

2.如下讲下正则表达式中的常见meta字符

(1).POSIX BRE与ERE中都有的meta字符:

\   :  通常用于打开或关闭后续字符的特殊含义,如\(...\)与\{...\}

.   :   匹配任何单个字符(除NUL)

*  :   匹配其前的任何数目或没有的单个字符,例: . 表示任一字符, 则 .* 匹配任一字符的任意长度

^  :   匹配紧接着的正则表达式,BRE中仅在正则表达式的开头有特殊的含义,ERE中在任何位置都有特殊含义

$  :   匹配前面的正则表达式,在字符串或者行结尾处。BRE中仅在正则表达式的结尾处有特殊的含义,ERE中在任何位置都有特殊含义

[]  :   匹配方括号内的任一字符,其中可用连字符(-)指的连续字符的范围;^符号苦出现在方括号的第一个位置,则表示匹配不在列表中的任一字符,

(2).POSIX BRE中才有的字符:

\{n,m\} : 区间表达式,匹配在它前面的单个字符重现的次数区别。\{n\}指重现n次;\{n,m\}指重现n至m次;

\( \) : 保留空间,可以将最多9个独立的子模式存储在单个模式中。如\(ab\).*\1 : 指匹配ab组合的两次重现,中间可存在任意数目的字符。

\n : 重复在\(与\)方括号内第n个子模式至此点的模式。

(3).POSIX ERE中才有的字符:

{n,m} : 与BRE的\{n,m\}功能相同

+ : 匹配前面正则表达式的一个或多个扩展

? : 匹配前面正则表达式的零个或一个扩展

| : 匹配|符号前或后的正则表达式

( ) : 匹配方括号括起来的正则表达式群

(4). 方括号([])表达式

4.1.字符集  [:  :]

标识字符集,有如下几种:

[::alnum] : 数字字符 [:digit:] : 数字字符 [:punct:] : 标点符号字符
[:alpha:] : 字母字符 [:graph:] : 非空格字符  [:space:] : 空格字符
[:blank:] : 空格与定位字符 [:lower:] : 小写字母字符 [:upper:] : 大写字母字符
[:cntrl:] : 控制字符 [:print:] : 可显示的字符 [:xdigit:] : 16进制数字


二。通配符

        bash shell本身不支持正则表达式,使用正则表达式的是shell命令和工具,如grep,sed,awk。

        bash shell可以使用正则表达式中的一些元字符实现通配(Globbing)功能。

        通配是把一个包含通配符的非具体文件名扩展存储在计算机,服务器或者网络上的一批具体文件名的过程。(可以看出通配主要应用匹配文件名上,而正则主要应用于字符串上


* - 通配符,代表任意字符(0到多个)
? - 通配符,代表一个字符
# - 注释
/ - 跳转符号,将特殊字符或通配符还原成一般符号
| - 分隔两个管线命令的界定
; - 连续性命令的界定
~ - 用户的根目录
$ - 变量前需要加的变量值
! - 逻辑运算中的"非"(not)
/ - 路径分隔符号
>, >> - 输出导向,分别为"取代"与"累加"
' - 单引号,不具有变量置换功能
" - 双引号,具有变量置换功能
` - quote符号,两个``中间为可以先执行的指令
() - 中间为子shell的起始与结束
[] - 中间为字符组合
{} - 中间为命令区块组合
Ctrl+C - 终止当前命令
Ctrl+D - 输入结束(EOF),例如邮件结束的时候
Ctrl+M - 就是Enter
Ctrl+S - 暂停屏幕的输出
Ctrl+Q - 恢复屏幕的输出
Ctrl+U - 在提示符下,将整行命令删除
Ctrl+Z - 暂停当前命令
&& - 当前一个指令执行成功时,执行后一个指令
|| - 当前一个指令执行失败时,执行后一个指令


三。IO重定向

      在我们设置定时任务的时候经常会使用标准输出和标准错误输出。这个在Linux是一个非常重要的概念,而且这个很有用。程序应该有数据库的来源端、数据的目的端,以及报告问题的地方,它们被称为标准输入、标准输出以及标准错误输出。


重定向与管道

Shell提供了数种语法,可以修改默认的IO的来源端和目的端,就是标准输入和输出的地方。

< 修改标准输入 sort < ucid.txt 默认下,标准输入为终端,此时可以更改为你想要的地方
<<
Command << delimiter 从标准输入中读入,直到遇到delimiter分割符
> 修改标准输出 ls -l > listinfo.txt 默认下,标准输出为终端,此时可以修改默认输出的地方。譬如可以将标准输出的内容写在文件中。
如果文件已存在,会被覆盖掉。
>>  输出附件到文件 ls -l >> listinfo.txt 与[>]不一样的是,[>]会清空原来的内容,而[>>]只是将标准输出追加到文件结尾处。
| 建立管道 program1 | program2 1. program1的标准输出为program2的标准输入;
2. 管道的执行效率比使用临时文件的程序起码高一个数量级;


文件描述符

在定时任务,我们经常在重定向的时候,喜欢这样操作。

33 1 * * * /home/weiyg/crontab/clear_logs.sh > /dev/null 2>&1

后面的 2>&1是什么意思呢,这里就要理解文件描述符和绑定重定向的概念了。

文件 文件描述符
输入文件——标准输入 0(默认为终端(网上有说默认为键盘的))
输出文件——标准输出 1(默认为终端)
错误输出文件——标准错误 2(默认为终端)

绑定重定向

Commond >&m 标准输出重定向到文件描述符m中
Command <&- 关闭标准输入
Command 0>&- 关闭标准输出

本文转自willis_sun 51CTO博客,原文链接:http://blog.51cto.com/willis/1846590,如需转载请自行联系原作者


上一篇:产品百科 | RTC iOS SDK 如何进行频道成员管理


下一篇:深入了解Linux I/O重定向