正则表达式

一、概念

        正则表达式,又称规则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。在众多语言中都可以支持正则表达式,如Perl、PHP、Java、Python、Ruby等。当然在Java中也可以通过处理字符串的方式达到检索,替换文本字符串的目的,但是有了正则表达式写代码更加简洁,通常两三行代码就可以达到目的,当然这也是建立在熟悉正则表达式的基础之上的。

二、正则表达式的规则

1. 任意一个字符表示匹配任意对应的字符,如a匹配a,7匹配7,-匹配-。

2. []代表匹配中括号中其中任一个字符,如[abc]匹配a或b或c。

3. -在中括号里面和外面代表含义不同,如在外时,就匹配-,如果在中括号内[a-b]表示匹配26个小写字母中的任一个;[a-zA-Z]匹配大小写共52个字母中任一个;[0-9]匹配十个数字中任一个。

4. ^在中括号里面和外面含义不同,如在外时,就表示开头,如^7[0-9]表示匹配开头是7的,且第二位是任一数字的字符串;如果在中括号里面,表示除了这个字符之外的任意字符(包括数字,特殊字符),如[^abc]表示匹配出去abc之外的其他任一字符。

5. .表示匹配任意的字符。

6. \d表示数字。

7. \D表示非数字。

8. \s表示由空字符组成,[ \t\n\r\x\f]。

9. \S表示由非空字符组成,[^\s]。

10. \w表示字母、数字、下划线,[a-zA-Z0-9_]。

11. \W表示不是由字母、数字、下划线组成。

12. ?: 表示出现0次或1次。

13. +表示出现1次或多次。

14. *表示出现0次、1次或多次。

15. {n}表示出现n次。

16. {n,m}表示出现n~m次。

17. {n,}表示出现n次或n次以上。

18. XY表示X后面跟着Y,这里X和Y分别是正则表达式的一部分。

19. X|Y表示X或Y,比如"food|f"匹配的是foo(d或f),而"(food)|f"匹配的是food或f。

20. (X)子表达式,将X看做是一个整体。

二、Java中如何写正则表达式

在java中调用正则表达式的类是java.util.regex.Matcher和java.util.regex.Pattern,java.util.regex包是从jdk1.4开始提供的。有多种写法来使用正则表达式。

1. 仅仅是匹配

    1). 实现方式1,匹配一个数字。

public void regex1() {

        //要匹配的字符

        String str = "8";

        //正则表达式

        String regex = "[0-9]";

        //返回匹配的结果,匹配成功就返回true,失败就返回false,此次匹配返回true。

        boolean flag = Pattern.matches(regex, str);

        System.out.println(flag);

}

2). 实现方式2, 匹配3个到5个字母,大小写不限,包括3和5个。

public void regex2() {

    //要匹配的字符

    String str = "hello";

    //正则表达式

    String regex = "[a-zA-Z]{3,5}";

    //输出匹配的结果, 此次匹配返回true。

    System.out.println(str.matches(regex));

}

3). 实现方式3(此种实现方式最快), 匹配11位的电话号码,匹配规则:第一个数字是1,第二个数字是2,3,7,8中任一个,后面9位数字中不包含4。

public void regex3() {

    //要匹配的字符

    String str = "13656231253";

    //正则表达式

    String regex = "1[2378][0-35-9]{9}";

    //将给定的正则表达式编译为模式。 如果匹配需求较多,且需用同相同的regex去匹配,就可将这句写到静态模块里面,用的时候直接使用实例p

    Pattern p = Pattern.compile(regex);

    //创建一个匹配器,匹配给定的输入与此模式。

    Matcher m = p.matcher(str);

    //尝试将整个区域与模式进行匹配。

    boolean flag = m.matches();

    //输出匹配结果,此次结果为true

    System.out.println(flag);

}

2. 替换。

public void regexReplace () {

    //要匹配的字符

    String str = "12a6B985Ccv65";

    //正则表达式

    String regex = "[a-zA-Z]+";

    //正则表达式

    String regex2 = "\\d+";

    //将字符串中英文字母替换为&符号,输出12&6&985&65

    System.out.println(str.replaceAll(regex, "&"));

    //将字符串中单个数字或者连续的数字替换为0,输出0a0B0Ccv0

    System.out.println(str.replaceAll(regex2,"0"));

}

3. 切割,根据大写字母切割字符串。

public void outputStr() {

    String str = "oneTtowTthreeDfourJfive";

    String regex = "[A-Z]";

    String[] arr = str.split(regex);

    for (String s: arr) {

    System.out.print(s + " ");

    }

}

输出:one tow three four five



作者:Vic_is_new_Here
链接:https://www.jianshu.com/p/3c076c6b2dc8
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
上一篇:正则表达式的分组 功能


下一篇:C#正则表达式