MySQL模糊匹配查询like、regexp、in

  MySQL提供标准的SQL模式匹配,以及一种基于像Unix实用程序,如:vi、grep和sed的扩展正则表达式模式匹配的格式

一、SQL模式(% ,_)

  SQL的模式匹配允许你使用“_”匹配任何单个字符,而“%”匹配任意数目字符(包括零个字符)。在MySQL中,SQL的模式缺省是忽略大小写的。

  注意:在你使用SQL模式时,你不能使用=或!=;而使用LIKE或NOT LIKE比较操作符。

  语法:SELECT 字段 FROM 表 WHERE 某字段 Like 条件

  其中关于条件,SQL提供了两种匹配模式:

  1、百分号(%):表示任意个或多个字符。可匹配任意类型和长度的字符。

  示例1:

SELECT * FROM character WHERE name LIKE ‘%孙%';
即匹配姓名为“孙行者”,“行者孙,“行者孙”等包含“孙”类型的数据

  示例2:

SELECT * FROM character WHERE name LIke '%孙%' and name like '%行%';
即匹配姓名为“孙行者”,“行者孙,“行者孙”等包含“孙”和“行”的数据

  示例3:

SELECT * FROM character WHERE name LIke '%孙%行%‘;
只能匹配姓名为“孙行者”等类似“...孙...行...”的数据

  2、下划线(_):表示任意单个字符。匹配单个任意字符,它常用来限制表达式的字符长度语句:(可以代表一个中文字符)

  示例1:

SELECT * FROM character WHERE name LIKE ‘_三_';
即匹配姓名为“..三..”类型的数据,前后均只有一个字符

  示例2:

SELECT * FROM character WHERE name LIKE ‘_三';
即匹配姓名类似“...三”类型的数据,前面有且只有一个字符

  

二、正则模式

  正则表达式作用是匹配文本,将一个模式(正则表达式)与一个文本穿进行比较。

  MySQL用where子句对正则表达式提供了初步的支持,允许你指定用正则表达式过滤SELECT检索出的数据。

  1、MySQL正则表达式仅仅使SQL语言的一个子集,可以匹配基本的字符、字符串。

select * from wp_posts where post_name REGEXP 'hello';
可以检索出列post_name中所有包含hello的行

  2、.匹配除\n之外的任意单个字符

select * from wp_posts where post_name REGEXP '.og';
注:.是正则表达式中的一个特殊字符。它表示匹配一个字符,因此bog,cog,dog等等都能匹配。

  注意:

  关于大小写的区分:MySQL中正则表达式匹配(从版本3.23.4后)不区分大小写。

  如果要区分大小写,应该使用BINARY关键字,例如:

where post_name REGEXP BINARY 'Hello .000'

  3、^匹配字符串开始位置,如查询所有姓王的人名

select name from 表名 where name REGEXP '^王';

  4、$匹配字符串结束位置,如查询所有姓名末尾是“明”的人名

select name from 表名 where name REGEXP '明$';

  5、进行OR匹配

  为搜索两个串之一(或者这个串,或者为另外一个串),使用|。

  |作为OR操作符,表示匹配其中之一。可以给出两个以上的OR条件。

select * from products where pro_id REGEXP '1000|2000';
这样就1000和2000都能匹配并返回,当然,使用多个|就可以匹配多个串

  6、[ ]匹配任何单一字符,是另一种形式的OR语句,可缩写的OR语句

  例如,匹配范围:[0123456789]可以匹配0到9,[1-4][4-9]也是合法的范围。

  此外,范围不一定只是数值的,[a-z]匹配任意字母字符。

  例如,查询出w/z/s开头的人的人名

SELECT prod_name FROM products WHERE prod_name REGEXP '^[wzs]';

  7、[^....]匹配不包含在[ ]的字符,如查询出chenmin之外的人名

SELECT prod_name FROM products WHERE prod_name REGEXP '^[wzs]';

  注:^的双重用途:在集合中(用[ ]定义),它用来否定该集合。否则,用来指串的开始

  8、匹配特殊字符使用\\进行转义

  \\为前导。即转义,正则表达式内具有特殊意义的所有字符都必须以这种方式转义。

(1)\\-   表示查找-
(2)\\. 表示查找.
(3)\\f 表示换页
(4)\\n 表示换行
(5)\\r 表示回车
(6)\\t 表示制表
(7)\\v 表示纵向制表

  注:为了匹配\本身,需要使用\\\

  9、匹配字符类

(1)[:alnum:]    任意字母和数字(同[a-zA-Z0-9])
(2)[:alpha:] 任意字符(同[a-zA-A])
(3)[:blank:] 空格和制表符(同[\\t])
(4)[:digit:] 任意数字(同[0-9])
(5)[:lower:] 任意小写字母(同[a-z])
(6)[:upper:] 任意大写字母(同[A-Z])
(7)[:space:] 包括空格在内的任意空白字符(同 [\\f\\n\\t\\r\\v])
(8)[:cntrl:] ASCII控制字符(ASCII 0到31和127)
(9)[:graph:] 与["print:]相同,但不包括空格
(10)[:print:] 任意可打印字符
(11)[:punct:] 既不在 [:alnum:] 又不在 [:cntrl:] 中的任意字符
(12)[:xdigit:] 任意十六进制数字(同 [a-fA-F0-9])

  10、匹配多个示例,关于重复元字符

元字符              说明
* 0个或多个匹配
+ 1个或多个匹配(等于 {1, })
? 0个或1个匹配(等于 {0, 1})
{n} 指定数目的匹配
{n, } 不少于指定数目的匹配
{n ,m} 匹配数目的范围(m不超过255)

  例子:

select prod_name from products where prod_name REGEXP '[[:DIGIT:]]{4}';
如前所述,[:digit:]匹配任意数字,因而它为数字的一个几何。
[[:digit:]]{4}匹配连在一起的任意4位数字,当然,上面的例子也可以这样写REGEXP '[0-9][0-9][0-9][0-9]'

  11、定位符

^         文本的开始
$ 文本的末尾
[[:<:]] 词的开始
[[:>:]] 词的结尾

  注:like匹配整个串,而REGEXP匹配子串。

三、in查询

  叫in查询不是很合理,更合理的说法是:in其实和=类似,区别在于:=后面是一个值。in后面可以是多个值。

  示例1:

select * from role where name in("唐三");
即匹配姓名为“唐三”一行数据;

  示例2:

select * from role where name in("唐三","唐三藏");
即匹配姓名为“唐三”,“唐三藏”一行数据;

  示例3:

select * from role where name in("唐三","%行者%")
只匹配姓名为“唐三”一行数据;即in查询不支持模糊查询,如示例4

  示例4:

select * from role where name in("%行者%")
无匹配结果

  

四、like contact模糊查询

  CONCAT(str1,str2,…) 函数返回结果为连接参数产生的字符串。

select * from role where name like contact("%","三","%");
即匹配姓名为“唐三”,“唐三藏”等类型的数据数据;

  like contact模糊查询强大的地方在于可以对传进来的参数进行某查询,比如经前端提交上的数据,赋值给参数name,则可以select * from table where name like contact("%",${name},"%")

上一篇:SQL Server 创建索引方法


下一篇:SQL Server创建索引(转)