正则表达式
(英文:Regular Expression,在代码中常简写为regex)
正则表达式是一个字符串 使用单个字符串来描述 用来定义匹配规则 匹配一系列符合某个句法规则的字符串
在开发中 正则表达式通常被用来检索 替换那些符合某个规则的文本。
一、语法:
圆括号代表了组
(abc|def|ghi)表示abc def ghi中的任意一个 顺序也必须一样
1、字符类:
[abc]
含义:代表的是字符a、b 或 c
例如:匹配规则为"[abc]" ,那么需要匹配的内容就是字符a,或者字符b,或字符c的一个
[^abc]
含义:代表的是除了 a、b 或 c以外的任何字符
例如:匹配规则为"[^abc]",那么需要匹配的内容就是不是字符a,或者不是字符b,或不是字符c的任意一个字符
[a-zA-Z]
含义:代表的是a 到 z 或 A 到 Z,两头的字母包括在内
例如:匹配规则为"[a-zA-Z]",那么需要匹配的是一个大写或者小写字母
[0-9]
含义:代表的是 0到9数字,两头的数字包括在内
例如:匹配规则为"[0-9]",那么需要匹配的是一个数字
[a-zA-Z_0-9]
含义:代表的字母或者数字或者下划线(即单词字符)
例如:匹配规则为" [a-zA-Z_0-9] ",那么需要匹配的是一个字母或者是一个数字或一个下划线
2、预定义字符类:
.
含义:代表的是任何字符
例如:匹配规则为" . “,那么需要匹配的是一个任意字符。如果就想使用 . 的话,使用匹配规则”\."来实现
\d
含义:代表的是 0到9数字,两头的数字包括在内,相当于[0-9]
例如:匹配规则为"\d ",那么需要匹配的是一个数字
“[\d]” “[0-9]”
\w
含义:代表的字母或者数字或者下划线(即单词字符),相当于[a-zA-Z_0-9]
例如:匹配规则为"\w ",,那么需要匹配的是一个字母或者是一个数字或一个下滑线
3、数量词:
X?
含义:代表的是X出现一次或一次也没有
例如:匹配规则为"a?",那么需要匹配的内容是一个字符a,或者一个a都没有
X*
含义:代表的是X出现零次或多次
例如:匹配规则为"a*" ,那么需要匹配的内容是多个字符a,或者一个a都没有
X+
含义:代表的是X出现一次或多次
例如:匹配规则为"a+",那么需要匹配的内容是多个字符a,或者一个a
X{n}
含义:代表的是X出现恰好 n 次
例如:匹配规则为"a{5}",那么需要匹配的内容是5个字符a
X{n,}
含义:代表的是X出现至少 n 次
例如:匹配规则为"a{5, }",那么需要匹配的内容是最少有5个字符a
X{n,m}
含义:代表的是X出现至少 n 次,但是不超过 m 次
例如:匹配规则为"a{5,8}",那么需要匹配的内容是有5个字符a 到 8个字符a之间
二、例子
String qq="1234567";
boolean b=qq.matches("[1-9][0-9]{4,10}");
[]代表第一位数 [1-9]代表第一位数必须在1和9之间 {}代表范围 {4,10}代表第二位数到第十一位数
String ip="192.168.1.1";
boolean b=ip.matches("([0-9]{0,3}\\.){3}[0-9]{0,3}");
相当于("[0-9]{0,3}\.[0-9]{0,3}\.[0-9]{0,3}\.[0-9]{0,3}")
String email="piconjo@vip.qq.com";
boolean b=email.matches("\\w+@\\w+(\\.\\w+)+");
相当于("[0-9a-z_A-z_]+@[0-9a-z_A-z_]+\.[0-9a-z_A-z_]+\.[0-9a-z_A-z_]+")
String str = " 12 44 68 piconjo 19 36 ";//中间穿插着随机长度的空格
String[] a = str.trim().split(" +");
regex正则表达式 用到加号"+" 代表出现一次或多次
String ip = "192.168.1.1";
String[] aa = ip.split("\\.");
若regex为.的话 必须加双斜杠转义 否则无效
敏感词/违禁词屏蔽
String dirtySay = "Hello暴血暴力暴血血腥暴血World";
String cleanSay = dirtySay.replaceAll("(暴力|血腥)+", "*");/*替换All全部违禁词*/
这里的加号"+" 代表出现一次或多次
replaceAll:替换All全部违禁词