MySQL基础知识——正则表达式(上)

正则表达式的作用


正则表达式也叫做匹配模式(Pattern),它由一组具有特定含义的字符串组成,通常用于匹配和替换文本。


正则表达式的语法

SELECT column1, column2, ...  FROM table_name WHERE columnN REGEXP pattern;

正则表达式的关键字是REGEXP,后面接需要进行匹配的文本。


示例数据库

我们以customers表的数据为例:

MySQL基础知识——正则表达式(上)

表customers

简单的字符匹配

查找地址中含有12的记录,可以使用如下SQL:


SELECT * FROM customers
WHERE 地址 REGEXP '12'


结果为:

MySQL基础知识——正则表达式(上)

这和我们前面章节学的LIKE感觉没有多大区别,但是仔细看你会发现,如果直接把REGEXP换成LIKE是查找不到任何数据的,必须添加通配符'%'才可以实现相同功能。

这就是正则表达式REGEXP和LIKE的一个非常大的区别:REGEXP在列值内进行匹配,如果被匹配的文本在列值中出现, REGEXP将会找到它,相应的行将被返回 。

我们再看下面一个例子


SELECT * FROM customers
WHERE 地址 REGEXP '12.'


结果为:

MySQL基础知识——正则表达式(上)

这里多了一个 .,它是正则表达式中的特殊字符。它表示匹配任意一个字符,类似LIKE里面的_


OR匹配

查找地址中包含12或者17的记录,可以使用如下SQL:


SELECT * FROM customers
WHERE 地址 REGEXP '12|17'


结果为:

MySQL基础知识——正则表达式(上)

这里的 | 也是正则表达式中的特殊字符,表示或者的意思,类似OR语句。


匹配指定字符中的任意一个

查找地址中包含"京","城","道"中的任意一个,可以这样写SQL:


SELECT * FROM customers
WHERE 地址 REGEXP '[京城道]'


结果为:

MySQL基础知识——正则表达式(上)

这里的 [] 也是正则表达式中的特殊字符,也是或者的意思。


匹配范围

当我们要匹配某个范围的的数据时,例如0123456789,可以简写成[0-9],这里的特殊字符 -,表示某个区间的值。查找地址中包含3-9的记录,可以这样写SQL:


SELECT * FROM customers
WHERE 地址 REGEXP '[3-9]'


结果为

MySQL基础知识——正则表达式(上)

此外区间范围的不止有数值,字母也可以,例如[a-z],[A-Z]。

正则表达式内容较多,今天先介绍到这里,下一章我们再讲解剩余内容。


上一篇:像Excel一样使用SQL进行数据分析(下)


下一篇:SQL窗口函数OVER详细用法,一学就会(上)