反向引用
捕获会返回一个捕获组,这个分组是保存在内存中的,不仅可以在正则表达式外部通过程序进行引用,也可以在正则表达式内部进行引用,这种引用方式就是反向引用。
根据捕获组的命名规则,反向引用可分为:
1.数字编号组反向引用:\k或\number
2.命名编号组反向引用:\k或\‘name’
捕获组是匹配子表达式的内容按序号或者命名保存起来以便使用,主要是用来查找一些重复的内容或者替换指定字符。
Java捕获组
捕获组是把多个字符当一个单独单元进行处理的方法,它通过对括号内的字符分组来创建。
例如,正则表达式 (dog) 创建了单一分组,组里包含"d",“o”,和"g"。
捕获组是通过从左至右计算其开括号来编号。例如,在表达式((A)(B(C))),有四个这样的组:
((A)(B©))
(A)
(B©)
©
可以通过调用 matcher 对象的 groupCount 方法来查看表达式有多少个分组。groupCount 方法返回一个 int 值,表示matcher对象当前有多个捕获组。
还有一个特殊的组(group(0)),它总是代表整个表达式。该组不包括在 groupCount 的返回值中。
1 select
'ccabab' rlike "(\\w)(\\w)\\1\\2"
2 select
'abac' regexp '(\\w)(\\w)\\1\\2'
3 select
regexp_replace('ababcccdcd','(\\w)(\\w)\\1\\2','')
4 select
regexp_extract('ababcccdcd','(\\w)(\\w)\\1\\2',0)
注意:
1.反向引用数字用\\1
2.regexp_replace是全部替换
3.regexp_extract函数index=0,如果不则index默认为1,同时提取是第一配对的字段串
regexp_extract函数源码