勤劳一日,可得一夜安眠;勤劳一生,可得幸福长眠。
一. 简介
在实际开发中,基本每个项目都会用到正则表达式,比如在登录注册时需要验证用户输入的内容是否符合规定;甚至有时需要在字符串中查找截取符合要求的字符串,这时就需要使用到正则表达式。
二. 相关概念理解
2.1 什么是正则表达式?
正则表达式,又称正规表示法,其用“字符串”来描述一种规则特征。是对字符串操作的一种逻辑公式。正则表达式可以检测给定的字符串是否符合我们定义的逻辑规则,也可以从字符串中获取我们想要的特定部分。它可以迅速地用极简单的方式达到字符串的复杂控制。
2.2 正则表达式可以用来干什么?
- 验证字符串是否符合指定特征,比如验证是否为合法手机号码;
- 用来查找字符串,从一个长的文本中查找符合指定特征的字符串;
- 进行字符串替换,比普通替换更加强大;
三. 元字符
正则表达式预言由两种基本字符类型组成:原义文本字符和元字符。元字符使正则表达式具有处理能力,所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。
常见元字符及其描述如下:
^ 匹配输入字符串开始位置
$ 匹配输入字符串结束位置
. 匹配除换行意外的任意字符
| 或
, 分割
[] 包含,默认一个字符长度
[0-9] 匹配0~9的数字
[a-z] 匹配小写英文字母
[A-Z] 匹配大写英文字母
[a-zA-Z] 匹配英文字母
[a-zA-Z0-9] 匹配英文字母数字
[^] 不包含,默认一个字符长度
{n} 重复n次
{n,} 重复>= n次
{n,m} n<= 重复次数 <= m
* 重复次数 >= 0
+ 重复次数 >=1
? 重复次数0次或1次
\ 转义字符
\d 匹配数字
\w 匹配字母、数字或下划线
\s 匹配空白字符:空格、制表符、换页符等
\D 匹配非数字字符
\W 匹配所有与非字母、非数字、非下划线字符
\S 匹配非空白字符
简单举例说明一下如何使用上述元字符:手机号码正则匹配
- 11位数字匹配:
^[0-9]{11}$
,[0-9]表示阿拉伯数字0~9,{11}表示重复11次; - 11位数字,第一位为"1":
^1[0-9]{10}$
,1表示开始位置为"1",[0-9]{10}表示0~9的数字重复10次; - 11位数字,第一位为"1",第二位为"3"、"4"、"5"、"7"、"8":
^1[3|4|5|7|8][0-9]{9}&
,1表示第一位是1,[3|4|5|7|8]表示第二位是3、4、5、7或8,[0-9]{9}表示0到9的数字重复9次;
四. 常用正则表达式
// 1.手机号码
/**
* 手机号码
* 移动:134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188
* 联通:130,131,132,152,155,156,185,186
* 电信:133,1349,153,180,189
*/
NSString * MOBILE = @"^1(3[0-9]|5[0-35-9]|8[025-9])\\d{8}$";
/**
* 中国移动:China Mobile
* 134[0-8],135,136,137,138,139,150,151,157,158,159,182,187,188
*/
NSString * CM = @"^1(34[0-8]|(3[5-9]|5[017-9]|8[278])\\d)\\d{7}$";
/**
* 中国联通:China Unicom
* 130,131,132,152,155,156,185,186
*/
NSString * CU = @"^1(3[0-2]|5[256]|8[56])\\d{8}$";
/**
* 中国电信:China Telecom
* 133,1349,153,180,189
*/
NSString * CT = @"^1((33|53|77|8[019])[0-9]|349)\\d{7}$";
// 2.身份证号码
NSString *regex = @"^(\\d{14}|\\d{17})(\\d|[xX])$";
// 3.邮箱地址
NSString *regex = @"[A-Z0-9a-z._%+-]+@[A-Za-z0-9.-]+\\.[A-Za-z]{2,4}";
// 4.网址链接
NSString *regex = @"http(s)?:\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- .\\/?%&=]*)?";
// 10.英文字母开头
NSString *regex = @"^[A-Za-z]+$";
// 11.全英文字母
NSString *regex = @"^[A-Za-z]+$";
// 12.全英文大写字母
NSString *regex = @"^[A-Z]+$";
// 13.全英文小写字母
NSString *regex = @"^[a-z]+$";
// 14.全英文字母数字
NSString *regex = @"^[A-Za-z0-9]+$";
五. 如何使用这些正则表达式
5.1 NSPredicate(谓词匹配)
// 需要验证的字符串
NSString *mobilePhone = @"13809124913";
// 编写正则表达式,验证mobilePhone是否为手机号码
NSString *regex = @"^1[3|4|5|7|8][0-9]{9}$";
// 创建谓词对象并设定条件表达式
NSPredicate *predicate = [NSPredicate predicateWithFormat:@"SELF MATCHES %@",regex];
// 字符串判断,然后BOOL值
BOOL result = [predicate evaluateWithObject:mobilePhone];
NSLog(@"result : %@",result ? @"正规手机号码" : @"验证失败");
// result : 正规手机号码
5.2 NSString 字符串查找
- (NSRange)rangeOfString:(NSString *)aString options:(NSStringCompareOptions)mask;
NSRange range = [mobilePhone rangeOfString:regex options:NSRegularExpressionSearch];
if (range.location != NSNotFound) {
// 找到
NSLog(@"%@",NSStringFromRange(range));
}else{
//未找到
}
options中设定NSRegularExpressionSearch就是表示利用正则表达式匹配,会返回第一个匹配结果的位置。
5.3 NSRegularExpression(查找字符串)
使用系统的正则表达式类(NSRegularExpression)会返回匹配的多个结果。
NSError *error;
NSString *rangeRegex = @"[8]{4}";
NSRegularExpression *regular = [NSRegularExpression regularExpressionWithPattern:rangeRegex options:0 error:&error];
if (!error) {
NSTextCheckingResult *match = [regular firstMatchInString:mobilePhone options:0 range:NSMakeRange(0, [mobilePhone length])];
if (match) {
NSString *result = [mobilePhone substringWithRange:match.range];
NSLog(@"%@",result);
}
}else{
NSLog(@"error -- %@",error);
}