Shell正则表达式（2）- 正则表达式

2023-09-30 09:26:40

正则表达式与通配符

正则表达式用来在文件中匹配符合条件的字符串，正则是包含匹配。grep，awk，sed等命令可以支持正则表达式。
通配符用来匹配符号条件的文件名，通配符是完全匹配。ls，find，cp这些命令不支持正则表达式，所以只能使用shell自己的通配符来进行匹配。

通配符

符号	作用
*	匹配任意内容
？	匹配任意一个内容
[]	匹配括号中的一个字符

基础正则表达式

元字符	作用
*	前一个字符匹配0次或多次
.	匹配除了换行符外任意一个字符
^	匹配行首。例如：^hello会匹配以hello开头的行
$	匹配行尾。例如：hello$会匹配以hello结尾的行
[]	匹配中括号中指定的任意一个字符，只匹配一个字符。例如：[0-9]匹配任意一位数字，[a-z][0-9]匹配小写字和一位数字构成的两位字符
[^]	匹配除中括号的字符以外的任意一个字符。例如：[^0-9]匹配任意一位非数字字符，[^a-z]表示任意一位非小写字母
\	转义符。用于取消特殊符号的含义取消
\{n\}	表示前面的字符恰好出现n次。例如：[0-9]\{4\}匹配四位数字，[1][3-8][0-9]\{9\}匹配手机号码
\{n,\}	表示其前面的字符出现不小于n次。例如：[0-9]\{2,\}表示两位及以上的数字；左右两边边界不限定死，该正则无太大意义，类似于包含
\{n,m\}	表示其前面的字符至少出现n次，最少出现m次。例如：[a-z]\{6,8\}匹配6到8位的小写字母

“*”　前一个字符出现0次或多次

“a*”：匹配所有的内容，包括空白行
“aa*”：匹配至少包含一个a的行
“aaa*”：匹配至少包含二个a的行
“aaaa*”：匹配至少包含三个a的行

“.”　匹配除了换行符外任意一个字符

“s..d”：匹配在s和d这两个字母中间一定有两个字符的单词
”s.*d“：匹配在s和d这两个字母中间有任意字符个数的单词
”.*“：匹配所有内容

“^”　匹配行首　　“$”　匹配行尾

“^M”：匹配以M开头的行
“n$”：匹配以小写n结尾的行
“^$”：匹配空白行

“[]”　匹配中括号中指定的任意一个字符，只匹配一个字符

“s[ao]id”：匹配在s和i子母中，要么是a，要么是o
“[0-9]”：匹配任意一个数字
“^[a-z]”：匹配用小写字母开头的行

“[^]”　匹配除中括号的字符以外的任意一个字符

“^[^a-z]”：匹配不用小写字母开头的行
“^[^a-zA-Z”：匹配不用字母开头的行

“\”　转义符

“\.$”：匹配使用“.”结尾的行

“\{n\}”　表示前面的字符恰好出现n次

“a\{3\}”：匹配a字母连续出现三次的字符串
“[0-9]\{3\}”：匹配包含连续的三个数字的字符串

“\{n,\}”　表示其前面的字符出现不少于n次

“^[0-9]\{3,\}”：匹配最少用3个数字开头的行

“\{n,m\}”　匹配其前面的字符至少出现n次，最多出现m次

“sa\{1,3\}i”：匹配在字母a和字母i之间有至少一个a，最多出现三个a

Shell正则表达式（2）- 正则表达式