正则表达式不再难懂

2021-06-27 03:05:05

正则表达式

转载至《正则表达式思维导图，不再难懂》（推荐手机阅读）

导图内容解析

工具
- RegexBuddy
语法结构
字符
- [ab5@]
  匹配"a"或"b"或"5"或"@"
- [^abc]
  匹配a、b、c之外的任意字符
- [f-k]
  匹配“f"到"k"之间的字符
- [^A-F0-3]
  匹配“A"-"F","0"-"3"之外的任意一个字符
- \d
  任意一个数字，0~9
- \w
  任意一个字母、数字、汉字或下划线，A~Z、a~z、0~9、_和任意一个汉字
- \s
  任意空白符，包括空格、制表符、换行符
- .
  小数点可以匹配任意一个字符，换行除外（如果要匹配包括"\n"在内的所有字符，一般用[\s\S]）
- 普通字符：字母、数字、汉字、下划线，匹配与之相同的一个字符
- 简单转义字符：\n（换行）,\t（制表）,\\（\本身）和 \^...（\^等有特殊作用的符号如要匹配自己的话要用转义）
- 标准字符集合
  注意区分大小写，大写是相反的意思，匹配相反是不匹配
- 自定义字符集合
  [ ]方括号匹配方式，能够匹配方括号中的任意一个字符,^表示取反
量词(Quantifier)
修饰前面的一个表达式，如果要修饰多个表达式，就用( )把表达式包起来
- 贪婪模式（默认）
  匹配符合的最长的字符串
- 非贪婪模式（在量词后面加 ? 例：{m,n}? )
  匹配符合的最短的字符串
- {n}
  表达式重复n次
- {m,n}
  表达式至少重复m次，最多重复n次
- {m,}
  表达式至少重复m次
- ？
  匹配表达式0或1次，相当于{0,1}
- +
  表达式至少出现一次，相当于{1,}
- *
  表达式不出现或出现任意次，相当于{0,}
字符边界
零宽：匹配的不是字符而是位置，符合某种条件的位置
- ^
  与字符串开始的地方匹配
- $
  与字符串结束的地方匹配
- \b
  匹配一个单词的边界，当前位置前面的字符和后面的字符不全是\w
预搜索（零宽断言、环视）
零宽：匹配的不是字符而是位置，符合某种条件的位置
- (?=exp)
  断言自身出现的位置的后面能匹配表达式exp
- (?!exp)
  断言自身出现的位置的后面不能匹配表达式exp
- (?<=exp)
  断言自身出现的位置的前面能匹配表达式exp
- (?<!exp)
  断言自身出现的位置的前面不能匹配表达式exp
匹配模式
对文本的处理方式
- 每行都是一个字符串
- 在多行模式下，如果需要仅匹配字符串开始和结束位置，可以使用\A和\Z
- 整个文本看作一个字符串，只有一个开头一个结尾
- 使小数点"."可以匹配包含换行符(\n)在内的任意字符
- 匹配时忽略大小写
- 默认是区分大小写的
- IGNORECASE 忽略大小写模式
- SINGLELINE 单行模式
- MULTILINE 多行模式
选择符和分组
分支结构、捕获组合非捕获组
- （1）、在被修饰匹配次数的时候，括号中的表达式可以作为整体被修饰
- （2）、取匹配结果的时候，括号中的表达式匹配到的内容可以被单独得到
- （3）、每一对括号会分配一个编号，使用（）的捕获根据左括号的顺序从1开始自动编号。捕获编号为零的第一个捕获是整个正则表达式模式匹配的文本
- 反向引用：通过反向引用，可以对分组已捕获的字符串进行引用。
- | 分支结构
  左右表达式之间“或”关系，匹配左边或右边
- ( ) 捕获组
- (?:Expression) 非捕获组
  一些表达式中，不得不使用（），但又不需要保存（）中子表达式匹配的内容，这时可以用非捕获组来抵消（）带来的副作用。

码农公寓

正则表达式

导图内容解析

语法结构

量词(Quantifier) 修饰前面的一个表达式，如果要修饰多个表达式，就用( )把表达式包起来

字符边界 零宽：匹配的不是字符而是位置，符合某种条件的位置

匹配模式 对文本的处理方式

相关文章

量词(Quantifier)
修饰前面的一个表达式，如果要修饰多个表达式，就用( )把表达式包起来

字符边界
零宽：匹配的不是字符而是位置，符合某种条件的位置

匹配模式
对文本的处理方式