IP地址有4段组成,每一段数字的范围为0~255,在一段文本中提取ip地址可以这样
$src = 'src = alsdlk ks sdf2.3.3.4 234.193.1.120.1232 d.233.43.23.34 23.34.23.33 dfkl lksd\flk \lkjs.c lksf.c \
kldslfj.c lkdslkf.c lkkldsf.c';
$src =~ m/((?<![\w.])\b(([01]?\d\d?|2[0-4]\d|25[0-5])\.){3}([01]?\d\d?|2[0-4]\d|25[0-5]))\b(?![\w.])/;
print "1: ".$1."\n";
print "2: ".$2."\n";
print "3: ".$3."\n";
print "4: ".$4."\n";
效果为:
1: 23.34.23.33
2: 23.
3: 23
4: 33
使用语言为perl
注:该正则表达式被分成四部分
第一部分:是一个环视,表示在\b(单词的开始符号)前不能有的字符,即在\b前不能有点号“.”或字母
第二部分:是三个选择分支,第一个匹配是的0~199的范围,第二个分支匹配200~249的范围,
第三个匹配250~255的范围,在后面有一个{3},表示连续出现3个这样的字符串
第三部分跟第二部分一样,只是匹配没有点号“.”
第四部分用了一个环视:表示在\b(单词结束符号)后不应该出现点号"."或字母
注意:环视不会捕获字符串,即不会存储在$x中的