正则表达式的作用
正则表达式也叫做匹配模式(Pattern),它由一组具有特定含义的字符串组成,通常用于匹配和替换文本。
正则表达式的语法
SELECT column1, column2, ... FROM table_name WHERE columnN REGEXP pattern;
正则表达式的关键字是REGEXP,后面接需要进行匹配的文本。
示例数据库
我们以customers表的数据为例:
表customers
简单的字符匹配
查找地址中含有12的记录,可以使用如下SQL:
SELECT * FROM customers WHERE 地址 REGEXP '12'
结果为:
这和我们前面章节学的LIKE感觉没有多大区别,但是仔细看你会发现,如果直接把REGEXP换成LIKE是查找不到任何数据的,必须添加通配符'%'才可以实现相同功能。
这就是正则表达式REGEXP和LIKE的一个非常大的区别:REGEXP在列值内进行匹配,如果被匹配的文本在列值中出现, REGEXP将会找到它,相应的行将被返回 。
我们再看下面一个例子
SELECT * FROM customers WHERE 地址 REGEXP '12.'
结果为:
这里多了一个 .,它是正则表达式中的特殊字符。它表示匹配任意一个字符,类似LIKE里面的_。
OR匹配
查找地址中包含12或者17的记录,可以使用如下SQL:
SELECT * FROM customers WHERE 地址 REGEXP '12|17'
结果为:
这里的 | 也是正则表达式中的特殊字符,表示或者的意思,类似OR语句。
匹配指定字符中的任意一个
查找地址中包含"京","城","道"中的任意一个,可以这样写SQL:
SELECT * FROM customers WHERE 地址 REGEXP '[京城道]'
结果为:
这里的 [] 也是正则表达式中的特殊字符,也是或者的意思。
匹配范围
当我们要匹配某个范围的的数据时,例如0123456789,可以简写成[0-9],这里的特殊字符 -,表示某个区间的值。查找地址中包含3-9的记录,可以这样写SQL:
SELECT * FROM customers WHERE 地址 REGEXP '[3-9]'
结果为
此外区间范围的不止有数值,字母也可以,例如[a-z],[A-Z]。
正则表达式内容较多,今天先介绍到这里,下一章我们再讲解剩余内容。