javascript的正则表达式学习

关于反向引用

复制代码 代码如下:

// 测试函数
function matchReg(reg, str) {
var result = str.match(reg);
if(result) {
console.dir(result);
} else {
console.log('match failed');
}
}

var reg = /([A-Za-z]{0,6})\1/;
var str = 'AndrewAndrew';
// 测试通过
matchReg(reg, str);

//通过(?:pattern)的方式,不记录子表达式匹配的内容(本例中为Andrew)
//所以\1对子表达式匹配内容的引用失败了
//注意:这里强调的是子表达式所匹配的内容,而不是子表达式本身
reg = /(?:[a-zA-Z]{0,6})\1/;
// 测试不通过
matchReg(reg, str);

关于子表达式的定义
var parse_number = /^-?\d+(?:\.\d*)?(?:e[+\-]?\d+)?$/i;
这是一个解析数字的正则表达式,其中的子表达式有(?:\.\d*)和(?:e[+\-]?\d+)
\.和\-分别是对.和-的转义表达
顺便复习下.表示除换行符以外的其他字符
-一般用于[a-zA-Z0-9]表示匹配范围
如果其中没?:例如(\.\d*)那么按照先后顺序,反向引用的关系如下
\1-->(\.\d*)
\2-->(e[+\-]?\d+)
如果有更多的话,就以此类推\3 \4 \5....
再次强调,引用的是子表达式匹配的内容,是具体的文本
关于正向预查

复制代码 代码如下:

var reg = /I like (?=shanghai)/;
var str = 'I like shanghai';
matchReg(reg, str); //测试通过

str = 'I like beijing';
matchReg(reg, str); //不通过

跑下上面的代码,就马上理解什么算是正向预查了,如上面的例子,通过(?=pattern)的形式,正则 表达式预测下后面的内容是不是符合要求,如果是那就顺利匹配.
相对地,(?!=pattern)的使用意图正好与(?=pattern)相反,就不复述了
关于贪心和非贪心匹配模式

复制代码 代码如下:

// 贪心
var reg = /\d{1,}/;
var str = '1999';
matchReg(reg, str); // result[0]为1999 能多匹配就多匹配

// 非贪心
reg = /\d{1,}?/;
matchReg(reg, str); // result[0]为1 只匹配了一个

从上面的结果很容易看出"贪心"和"非贪心"的含义
pattern?这就表明非贪心匹配模式,一般情况就是贪心的
关于Regexp对象exec函数返回的结果

复制代码 代码如下:

// 关于返回结果是个什么
// matchReg函数中console.dir(result)能说明问题,firebug中一看便知
关于string的replace函数
function camelize(str) {
return str.replace(/-(\w)/g, function(inputStr, p1) {
console.log(p1);
return p1.toUpperCase();
});
}
console.log(camelize('background-color'));

function uncamelize(str, sep) {
sep = sep || '-';
return str.replace(/([a-z])([A-Z])/g, function(inputStr, p1, p2) {
console.log('p1:%s, p2:%s', p1, p2);
return p1 + sep + p2;
});
}
console.log(uncamelize('backgroundColor', '-'));

上面两个例子,主要用于说明replace函数的用法,当然还有search,split等函数可以充分利用正则表达式的优势
关于javascript正则表达式的最佳实践
就一句话:尽量的精简,不要复杂,利于读懂和维护!

上一篇:Dubbo RPC源码解读


下一篇:Python 自动化之验证码识别