JavaScript(3)—— 正则表达式

---恢复内容开始---

正则表达式

这是写的正则表达式,正则表达式的点比较多,也比较细。所以有些地方我们得注意的比较多。正则表达式在JS中是很重要的一个部分,其中他的语法都得牢记。不过最好还是理解性记忆会比较好。额,好像没啥可以说的了,好好加油。努力多点进度,,恩。

【正则表达式】

使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。也就是按照某种规则(正则表达式)去匹配符合条件的字符串。

【语法】

在JS中,通过内置对象RegExp支持正则表达式。

有字面量跟构造函数这两种方式实例化RegExp对象。

字面量:语法:var 变量=/正则表达式文本/修饰符(g/i/m);

g:global,全文搜索,默认搜索到第一个结果停止;

i: ingore case,忽略大小写,默认大小写敏感;

m:multiple lines,多行搜索;

如:var reg=/\bis\b/g;(其中\bis\b代表搜索is)

构造函数:语法: var 变量=RegExp('正则表达式文本','修饰符(g/i/m)');

【其他】

元字符:在正则表达式中含有特殊含义的非字母字符。如\b代表的单词边界。

特殊字符(如 *,+,$,^,|,\,(),{},[])这些元字符必须用右斜线‘\’来转义。

字符类:一般情况下,正则表达式一个字符对应字符串一个字符。若要匹配多项,可以用元字符[]来构建一个简单的类(符合某些特征的对象,甚至是一个泛指,而不是特指)。

如:要匹配abc字母,就可以用[abc],把字母a,b,c归为一类,表达式就可以同时匹配这三个字符。

字符类取反:用^来表示,如[^abc],就是匹配除字母a,b,c之外的字符。

范围类:就是匹配这一范围类的字符,用[];如:[a-z],代表的就是匹配小写字母a到z的字符,包括a跟z,同义,[0-9]代表匹配数值0-9的任意字符,范围类内部可以连写,所以[a-zA-Z0-9]代表匹配大小写字母跟数字的一个范围类。

预定义类:‘.’             ‘ 除了回车符跟换行符之外的所有字符’

     ‘\d’           '数字字符'

     '\D'     '非数字字符'

       '\s'       '空白符'

      '\S'     '非空白符'

     '\w'          '单词字符(字母、数字、下划线)'

     '\W'         '非单词字符'

如:ab[0-9][^\r\n]就如同ab\d.(匹配的是数字及除了回车符跟换行符的任意字符)

边界:就是在正则表达式中决定开头、结尾的字符。如

     ‘^’            ‘ 以***开始’

     ‘$’            '以***结尾'

     '\b'     '单词边界'

       '\B'       '非单词边界'

量词:匹配一个出现n次的字符串。如:

     ‘?’            ‘出现零次或一次’

     ‘+’            '至少出现一次'

     '*'        '出现任意次'

       '{n}'       '出现n次'

     ‘{n,m}’      ‘ 出现n到m次’

     ‘{n,}’          '至少出现n次'

贪婪模式(默认):尽可能多的匹配。如:'12345678'.replace('/\d{3,6}/g',X)则会变成X78;

非贪婪模式:让正则表达式尽可能少的匹配。在量词后面加上?即可。如;'12345678'.replace('/\d{3,6}?/g',X)则会变成XX78;

分组:让一个单词hello匹配三次,并不是hello{3}(这是在hell紧挨的字符(即o)匹配三次)。所以得用()分组,即变为(hello){3}。而若想忽略分组,则在()中添加?:即可。

或(|):如:'helloword'.replace('hello|word','X')的匹配结果为XX;而'helloper'.replace('hel(lo|p)er','X')的匹配结果为XX。

反向引用:如:想将1997-11-21换成11/21/1997,位置会发生变动。则:'1997-11-21'.replace('(\d{4})-(\d{2})-(\d{2})','$2$1$3')。使用$n代表一个整体变量。

前瞻:正则表达式是从文本头部向尾部解析,文本尾部方向称为前。前瞻就是在正则表达式匹配到规则的时候,向前检查是否符合断言,后瞻方向相反。JS不支持后顾。

符合和不符合的特定断言,称为肯定/正向匹配和否定/负向匹配。

正向前瞻:exp(?=assert);如 'a2*34vv'.replace(/\w(?=\d)/,'X')匹配结果为X3*X4vv。

负向前瞻:exp(?!assert);如 'a2*34vv'.replace(/\w(?!\d)/,'X')匹配结果为aX*3XXX。

对象属性:除了前面的g,i,m外,还有:

lastIndex:是当前表达式匹配内容的最后一个字符的下一个位置。

source:正则表达式的文本字符串。

【正则表达式方法】

本身的方法:test跟exec方法

test方法(RegExp.prototype.test(str)):用于测试字符串参数中是否存在匹配正则表达式模式的字符串。

exec方法(RegExp.prototype.exec(str)):使用正则表达式模式对字符串搜索,并将更新全局RegExp对象的属性以反映匹配结果。如果没有匹配的文本则返回null,否则则返回一个结果数组:

-index  声明匹配文本的第一个字符位置。

-input  存放被检索的字符串string。

调用非全局的RegExp对象的exec()方法时,返回数组。第一个元素是与正则表达式相匹配的文本,第二个元素是与RegExpObject第一个表达式相匹配的文本(如果有的话),第二个元素是与RegExp对象第二个表达式相匹配的文本(如果有的话),以此类推。

---恢复内容结束---

上一篇: