正则表达式
用来描述一串字符串的字符串
定界符
除了字母数字反斜线之外的所有字符都可以
/ / (强制使用)
| |
!!
原子
在自然界中的最小单位 叫做原子
正则中的原子:可以打印的字母,数字,符号,不可打印的字符 \n \r \t
Windows中有\n和\t unix中只有\n
\t 横向跳到下一制表位置
有特殊作用的符号作为原子使用需要加转义符 + * . ? [] () {} /
直接使用一些代表范围的原子 (重要)
\d 数字
\D 非数字
\w 任意一个字符 字母(大写 小写) 数字 下划线
\W 非字符
\s 空白 空格 换行 TAB ....
\S 非空白
自定义原子列表
[09] 0或9 注意:中间没有逗号
09 是两个原子 [09] 是一个原子
[0-9] 表示 范围----所有数字 [a-zA-Z]
[3|t] 表示 匹配3或t
\d [0-9]
\D [^0-9]
\w [a-zA-Z0-9_]
\s [\n\t\r\f\v]
[^0-9] 表示 非数字
注意:^在括号中,并且紧挨左边的中括号,才表示取反。
.(点)
默认情况下,代表除换行符之外的任意字符 [^\n]
原字符
修饰原子的,不能单独使用
{n,m} 从n到m个 最少有n个 最多有m个
注意:m和n中间有逗号!
{n,} 至少有n个
{0,m} 至多有m个
* 表示前面的原子可以出现 0次 1次 或 多次
+ 表示前面的原子可以出现 1次 或 多次
? 表示前面的原子可以出现 0次 或 1次
* {0,}
+ {1,}
? {0,1}
| 表示或 优先级很低
\b 表示边界
\B 表非边界
//“有没有” 的重点
^ 写在第一个原子的前面 代表以第一个原子开始
$ 写在后一个定界符的左边 表示以XX结束
圆括号的使用
1.改变优先级
2.作为一个大原子使用
3.作为子模式使用 //“是不是” 的重点
(?:.*)括号中的?: 取消子模式
反向引用
/(\d{4})([#-])\d{2}\\2\d{2} \d{2}:\d{2}:\d{2}/
贪婪匹配
禁止贪婪匹配:.*?.+?
优先级
\ 转义符优先级最高
() (?:) []
* + ? {}
^ $
| 或的优先级 最低(用或的选项应该用()括起来不能用[])
模式修正符
i 不区分大小写
s 将字符串视为单行 .可以匹配所有字符
U 禁止贪婪匹配 U和?会抵消 (不要同时使用)
个人认为:
有^和$的是匹配一个字符串从头到尾的匹配,如:注册验证。叫“是不是”。验证是不是我们要的格式。
而没有^和$时,为“有没有”,顾名思义,就是字符串里有没有要搜的正则
\r \n 在windos系统中用于匹配字符窜中是否由回车换行出现
\n 在Linux系统中用于匹配字符窜中是否由回车换行出现
Preg_replace() 的应用,返回的是字符串,不是数组 (注意:$3,${1}1)
<?php
$string = 'April 15, 2003';
$pattern = '/(\w+) (\d+), (\d+)/i';
$replacement = '${3}-$1-${2}';
echo preg_replace($pattern, $replacement, $string);
?>
结果:
2003-April-15
Preg_match()
Preg_match_all()
Ip ^[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}$