正则表达式

勤劳一日,可得一夜安眠;勤劳一生,可得幸福长眠。

一. 简介

  在实际开发中,基本每个项目都会用到正则表达式,比如在登录注册时需要验证用户输入的内容是否符合规定;甚至有时需要在字符串中查找截取符合要求的字符串,这时就需要使用到正则表达式。

二. 相关概念理解

2.1 什么是正则表达式?

  正则表达式,又称正规表示法,其用“字符串”来描述一种规则特征。是对字符串操作的一种逻辑公式。正则表达式可以检测给定的字符串是否符合我们定义的逻辑规则,也可以从字符串中获取我们想要的特定部分。它可以迅速地用极简单的方式达到字符串的复杂控制。

2.2 正则表达式可以用来干什么?

  • 验证字符串是否符合指定特征,比如验证是否为合法手机号码;
  • 用来查找字符串,从一个长的文本中查找符合指定特征的字符串;
  • 进行字符串替换,比普通替换更加强大;

三. 元字符

  正则表达式预言由两种基本字符类型组成:原义文本字符元字符元字符使正则表达式具有处理能力,所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。

  常见元字符及其描述如下:

^	匹配输入字符串开始位置
$	匹配输入字符串结束位置
.	匹配除换行意外的任意字符
|	或
,	分割
[]	包含,默认一个字符长度
[0-9]	匹配0~9的数字
[a-z]	匹配小写英文字母
[A-Z]	匹配大写英文字母
[a-zA-Z]	匹配英文字母
[a-zA-Z0-9]	匹配英文字母数字
[^]	不包含,默认一个字符长度
{n}	重复n次
{n,}	重复>= n次
{n,m}	n<= 重复次数 <= m
*	重复次数 >= 0
+	重复次数 >=1
?	重复次数0次或1次
\	转义字符
\d	匹配数字
\w	匹配字母、数字或下划线
\s	匹配空白字符:空格、制表符、换页符等
\D	匹配非数字字符
\W	匹配所有与非字母、非数字、非下划线字符
\S	匹配非空白字符

  简单举例说明一下如何使用上述元字符:手机号码正则匹配

  • 11位数字匹配:^[0-9]{11}$,[0-9]表示阿拉伯数字0~9,{11}表示重复11次;
  • 11位数字,第一位为"1":^1[0-9]{10}$,1表示开始位置为"1",[0-9]{10}表示0~9的数字重复10次;
  • 11位数字,第一位为"1",第二位为"3"、"4"、"5"、"7"、"8":^1[3|4|5|7|8][0-9]{9}&,1表示第一位是1,[3|4|5|7|8]表示第二位是3、4、5、7或8,[0-9]{9}表示0到9的数字重复9次;

四. 常用正则表达式

// 1.手机号码
/**
 * 手机号码
 * 移动:134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188
 * 联通:130,131,132,152,155,156,185,186
 * 电信:133,1349,153,180,189
 */
NSString * MOBILE = @"^1(3[0-9]|5[0-35-9]|8[025-9])\\d{8}$";
/**
 * 中国移动:China Mobile
 * 134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188
 */
NSString * CM = @"^1(34[0-8]|(3[5-9]|5[017-9]|8[278])\\d)\\d{7}$";
/**
 * 中国联通:China Unicom
 * 130,131,132,152,155,156,185,186
 */
NSString * CU = @"^1(3[0-2]|5[256]|8[56])\\d{8}$";
/**
 * 中国电信:China Telecom
 * 133,1349,153,180,189
 */
NSString * CT = @"^1((33|53|77|8[019])[0-9]|349)\\d{7}$";
// 2.身份证号码
NSString *regex = @"^(\\d{14}|\\d{17})(\\d|[xX])$";
// 3.邮箱地址
NSString *regex = @"[A-Z0-9a-z._%+-]+@[A-Za-z0-9.-]+\\.[A-Za-z]{2,4}";
// 4.网址链接
NSString *regex = @"http(s)?:\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- .\\/?%&=]*)?";

// 10.英文字母开头
NSString *regex = @"^[A-Za-z]+$";
// 11.全英文字母
NSString *regex = @"^[A-Za-z]+$";
// 12.全英文大写字母
NSString *regex = @"^[A-Z]+$";
// 13.全英文小写字母
NSString *regex = @"^[a-z]+$";
// 14.全英文字母数字
NSString *regex = @"^[A-Za-z0-9]+$";

五. 如何使用这些正则表达式

5.1 NSPredicate(谓词匹配)

// 需要验证的字符串
NSString *mobilePhone = @"13809124913";
// 编写正则表达式,验证mobilePhone是否为手机号码
NSString *regex = @"^1[3|4|5|7|8][0-9]{9}$";
// 创建谓词对象并设定条件表达式
NSPredicate *predicate = [NSPredicate predicateWithFormat:@"SELF MATCHES %@",regex];
// 字符串判断,然后BOOL值
BOOL result = [predicate evaluateWithObject:mobilePhone];
NSLog(@"result : %@",result ? @"正规手机号码" : @"验证失败");
// result : 正规手机号码

5.2 NSString 字符串查找

- (NSRange)rangeOfString:(NSString *)aString options:(NSStringCompareOptions)mask;
NSRange range = [mobilePhone rangeOfString:regex options:NSRegularExpressionSearch];
if (range.location != NSNotFound) {
    // 找到
    NSLog(@"%@",NSStringFromRange(range));
}else{
    //未找到
}

  options中设定NSRegularExpressionSearch就是表示利用正则表达式匹配,会返回第一个匹配结果的位置。

5.3 NSRegularExpression(查找字符串)

  使用系统的正则表达式类(NSRegularExpression)会返回匹配的多个结果。

NSError *error;
NSString *rangeRegex = @"[8]{4}";
NSRegularExpression *regular = [NSRegularExpression regularExpressionWithPattern:rangeRegex options:0 error:&error];
if (!error) {
    NSTextCheckingResult *match = [regular firstMatchInString:mobilePhone options:0 range:NSMakeRange(0, [mobilePhone length])];
    if (match) {
        NSString *result = [mobilePhone substringWithRange:match.range];
        NSLog(@"%@",result);
    }
}else{
    NSLog(@"error -- %@",error);
}
上一篇:Training: RegexMini (Training, Regex)


下一篇:Regex 正则表达式的练习