界定符的三种书写方式:
regexpal工具(正规则表达调试工具):
可以实时显示效果出来。
原子:
可见原子,即uincode编码表中的某个字符
不可见原子:
为了避免编码问题导致匹配不正确,要把文字转换为unicode编码转码后在进行匹配,这样就没有gbk\utf等编码的无法匹配问题。
元字符之原子的筛选方式:
|:或者的意思
【】:表示里面任意一个出现的字符,都将被匹配。例如:
【^】:匹配里面原子以外的,跟【】相反,格式只能如此【^,改变^位置会改变意思。例如:
除了789,其他都被匹配到了!!!!
多重匹配,以下图片匹配a-z、A-Z和0-9。