正则表达式与通配符
- 正则表达式用来在文件中匹配符合条件的字符串,正则是包含匹配。grep,awk,sed等命令可以支持正则表达式。
- 通配符用来匹配符号条件的文件名,通配符是完全匹配。ls,find,cp这些命令不支持正则表达式,所以只能使用shell自己的通配符来进行匹配。
通配符
符号 | 作用 |
* | 匹配任意内容 |
? | 匹配任意一个内容 |
[] | 匹配括号中的一个字符 |
基础正则表达式
元字符 | 作用 |
* | 前一个字符匹配0次或多次 |
. | 匹配除了换行符外任意一个字符 |
^ | 匹配行首。例如:^hello会匹配以hello开头的行 |
$ | 匹配行尾。例如:hello$会匹配以hello结尾的行 |
[] |
匹配中括号中指定的任意一个字符,只匹配一个字符。 例如:[0-9]匹配任意一位数字,[a-z][0-9]匹配小写字和一位数字构成的两位字符 |
[^] | 匹配除中括号的字符以外的任意一个字符。例如:[^0-9]匹配任意一位非数字字符,[^a-z]表示任意一位非小写字母 |
\ | 转义符。用于取消特殊符号的含义取消 |
\{n\} | 表示前面的字符恰好出现n次。例如:[0-9]\{4\}匹配四位数字,[1][3-8][0-9]\{9\}匹配手机号码 |
\{n,\} | 表示其前面的字符出现不小于n次。例如:[0-9]\{2,\}表示两位及以上的数字;左右两边边界不限定死,该正则无太大意义,类似于包含 |
\{n,m\} | 表示其前面的字符至少出现n次,最少出现m次。例如:[a-z]\{6,8\}匹配6到8位的小写字母 |
“*” 前一个字符出现0次或多次
- “a*”:匹配所有的内容,包括空白行
- “aa*”:匹配至少包含一个a的行
- “aaa*”:匹配至少包含二个a的行
- “aaaa*”:匹配至少包含三个a的行
“.” 匹配除了换行符外任意一个字符
- “s..d”:匹配在s和d这两个字母中间一定有两个字符的单词
- ”s.*d“:匹配在s和d这两个字母中间有任意字符个数的单词
- ”.*“:匹配所有内容
“^” 匹配行首 “$” 匹配行尾
- “^M”:匹配以M开头的行
- “n$”:匹配以小写n结尾的行
- “^$”:匹配空白行
“[]” 匹配中括号中指定的任意一个字符,只匹配一个字符
- “s[ao]id”:匹配在s和i子母中,要么是a,要么是o
- “[0-9]”:匹配任意一个数字
- “^[a-z]”:匹配用小写字母开头的行
“[^]” 匹配除中括号的字符以外的任意一个字符
- “^[^a-z]”:匹配不用小写字母开头的行
- “^[^a-zA-Z”:匹配不用字母开头的行
“\” 转义符
- “\.$”:匹配使用“.”结尾的行
“\{n\}” 表示前面的字符恰好出现n次
- “a\{3\}”:匹配a字母连续出现三次的字符串
- “[0-9]\{3\}”:匹配包含连续的三个数字的字符串
“\{n,\}” 表示其前面的字符出现不少于n次
- “^[0-9]\{3,\}”:匹配最少用3个数字开头的行
“\{n,m\}” 匹配其前面的字符至少出现n次,最多出现m次
- “sa\{1,3\}i”:匹配在字母a和字母i之间有至少一个a,最多出现三个a