3. 量词
量词也称重复。掌握{m,n}的准确含义后,只需要记住一些简写形式。
3.1 简写形式
{m,} 表示至少出现m次。
{m} 等价于{m,m},表示出现m次。
? 等价于{0,1},表示出现或者不出现。记忆方式:问号的意思表示,有吗?
+ 等价于{1,},表示出现至少一次。记忆方式:加号是追加的意思,得先有一个,然后才考虑追加。
* 等价于{0,},表示出现任意次,有可能不出现。记忆方式:看看天上的星星,可能一颗没有,可能零散有几颗,可能数也数不过来。
3.2 贪婪匹配和惰性匹配
看如下的例子
- var regex = /\d{2,5}/g;
- var string = "123 1234 12345 123456";
- console.log( string.match(regex) );
- // => ["123", "1234", "12345", "12345"]
其中正则/\d{2,5}/,表示数字连续出现2到5次。会匹配2位、3位、4位、5位连续数字。
但是其是贪婪的,它会尽可能多的匹配。你能给我6个,我就要5个。你能给我3个,我就3要个。反正只要在能力范围内,越多越好。
我们知道有时贪婪不是一件好事(请看文章最后一个例子)。而惰性匹配,就是尽可能少的匹配:
- var regex = /\d{2,5}?/g;
- var string = "123 1234 12345 123456";
- console.log( string.match(regex) );
- // => ["12", "12", "34", "12", "34", "12", "34", "56"]
其中/\d{2,5}?/表示,虽然2到5次都行,当2个就够的时候,就不在往下尝试了。
通过在量词后面加个问号就能实现惰性匹配,因此所有惰性匹配情形如下:
- {m,n}?
- {m,}?
- ??
- +?
- *?
对惰性匹配的记忆方式是:量词后面加个问号,问一问你知足了吗,你很贪婪吗?
4. 多选分支
一个模式可以实现横向和纵向模糊匹配。而多选分支可以支持多个子模式任选其一。
具体形式如下:(p1|p2|p3),其中p1、p2和p3是子模式,用|(管道符)分隔,表示其中任何之一。
例如要匹配”good”和”nice”可以使用/good|nice/。测试如下:
- var regex = /good|nice/g;
- var string = "good idea, nice try.";
- console.log( string.match(regex) );
- // => ["good", "nice"]
但有个事实我们应该注意,比如我用/good|goodbye/,去匹配”goodbye”字符串时,结果是”good”:
- var regex = /good|goodbye/g;
- var string = "goodbye";
- console.log( string.match(regex) );
- // => ["good"]
而把正则改成/goodbye|good/,结果是:
- var regex = /goodbye|good/g;
- var string = "goodbye";
- console.log( string.match(regex) );
- // => ["goodbye"]
也就是说,分支结构也是惰性的,即当前面的匹配上了,后面的就不再尝试了。