使用findall()方法匹配
简介:
findall()方法用于在整个字符串中搜索所有符合正则表达式的字符串,并以列表的形式返回。如果匹配成功。则返回包含匹配结构的列表,否则返回空列表。
re.findall(pattern,string,flags)
例子1:
import re
pattern=r'mr_\w+'
string='MR_SHOP mr_shop'
match=re.findall(pattern,string,re.I)
print(match)
结果
['MR_SHOP', 'mr_shop']
例子2:
import re
string='项目名称MR_SHOP mr_shop'
match=re.findall(pattern,string,re.I)
print(match)
结果
['MR_SHOP', 'mr_shop']
注意:
import re
pattern=r'[1-9]{1,3}(\.[0-9]{1,3}){3}'
str1='127.0.0.1 192.168.1.66'
match=re.findall(pattern,str1)
print(match)
结果
['.1', '.66']
如果在指定的模式字符串中包含分组,则返回与分组匹配的文本列表。(也就是只匹配小括号中的模式字符串)
pattern=r'(\.[0-9]{1,3}){3}'
str1='127.0.0.1 192.168.1.66'
match=re.findall(pattern,str1)
print(match)
结果:
['.1', '.66']
这里分析一下,模式字符串(.[0-9]{1,3}){3}的意思。
首先,[0-9]和 \d 的意思完全相同都表示匹配数字,{1,3}表示匹配前面的字符最少1次,最多3次。{3}表示匹配前面的字符3次。
在这里也就是: 匹配 . (点)开始后面是数字(可以是0到9任意)然后面的数字可以是,一个或者两个,最多三个。也就是以下几种情况:
.0或者0.66,或者.192等。
{3}匹配3次,也就是这种类型连续出现三次,‘127.0.0.1 192.168.1.66’ 中,可以看到.0.0.1,出现了3次,.168.1.66也连续出现了三次。 所以结果:[’.1’,’.66’]。
如果要不匹配分组里面的则需改成如下:
第一种写法:
将整个模式字符串使用一对小括号进行分组。然后返回列表的每一个元素(是一个元组)的第一个元素。
import re
pattern=r'([1-9]{1,3}(\.[0-9]{1,3}){3})'
str1='127.0.0.1 192.168.1.66'
match=re.findall(pattern,str1)
for i in match:
print(i[0])
结果:
127.0.0.1
192.168.1.66
第二种方法:
在原有分组里加上?: 就把捕获组转变为一个非捕获组。
import re
pattern=r'[1-9]{1,3}(?:\.[0-9]{1,3}){3}'
str1='127.0.0.1 192.168.1.66'
match=re.findall(pattern,str1)
print(match)
['127.0.0.1', '192.168.1.66']
完毕…