【Web前端基础知识】关于前端正则表达式基本用法(下)

3. 量词

量词也称重复。掌握{m,n}的准确含义后,只需要记住一些简写形式。

3.1 简写形式

{m,} 表示至少出现m次。

{m} 等价于{m,m},表示出现m次。

? 等价于{0,1},表示出现或者不出现。记忆方式:问号的意思表示,有吗?

+ 等价于{1,},表示出现至少一次。记忆方式:加号是追加的意思,得先有一个,然后才考虑追加。

* 等价于{0,},表示出现任意次,有可能不出现。记忆方式:看看天上的星星,可能一颗没有,可能零散有几颗,可能数也数不过来。

3.2 贪婪匹配和惰性匹配

看如下的例子

  1. var regex = /\d{2,5}/g; 
  2. var string = "123 1234 12345 123456"; 
  3. console.log( string.match(regex) );  
  4. // => ["123", "1234", "12345", "12345"] 

其中正则/\d{2,5}/,表示数字连续出现2到5次。会匹配2位、3位、4位、5位连续数字。

但是其是贪婪的,它会尽可能多的匹配。你能给我6个,我就要5个。你能给我3个,我就3要个。反正只要在能力范围内,越多越好。

我们知道有时贪婪不是一件好事(请看文章最后一个例子)。而惰性匹配,就是尽可能少的匹配:

  1. var regex = /\d{2,5}?/g; 
  2. var string = "123 1234 12345 123456"; 
  3. console.log( string.match(regex) );  
  4. // => ["12", "12", "34", "12", "34", "12", "34", "56"] 

其中/\d{2,5}?/表示,虽然2到5次都行,当2个就够的时候,就不在往下尝试了。

通过在量词后面加个问号就能实现惰性匹配,因此所有惰性匹配情形如下:

  1. {m,n}?  
  2. {m,}? 
  3. ?? 
  4. +? 
  5. *? 

对惰性匹配的记忆方式是:量词后面加个问号,问一问你知足了吗,你很贪婪吗?

4. 多选分支

一个模式可以实现横向和纵向模糊匹配。而多选分支可以支持多个子模式任选其一。

具体形式如下:(p1|p2|p3),其中p1、p2和p3是子模式,用|(管道符)分隔,表示其中任何之一。

例如要匹配”good”和”nice”可以使用/good|nice/。测试如下:

  1. var regex = /good|nice/g; 
  2. var string = "good idea, nice try."; 
  3. console.log( string.match(regex) );  
  4. // => ["good", "nice"] 

但有个事实我们应该注意,比如我用/good|goodbye/,去匹配”goodbye”字符串时,结果是”good”:

  1. var regex = /good|goodbye/g; 
  2. var string = "goodbye"; 
  3. console.log( string.match(regex) );  
  4. // => ["good"] 

而把正则改成/goodbye|good/,结果是:

  1. var regex = /goodbye|good/g; 
  2. var string = "goodbye"; 
  3. console.log( string.match(regex) );  
  4. // => ["goodbye"] 

也就是说,分支结构也是惰性的,即当前面的匹配上了,后面的就不再尝试了。

上一篇:【Java】正则表达式


下一篇:java获取字符串中第一个数字的位置