p='''bottle\r\nbag\r\nbig\napple''' import re regex=re.compile(r'\bb(?P<middle>\w)(?P<tail>g)') mat=regex.finditer(p) print(mat) for m in mat: print(m.groups()) # 匹配到的所有分组(包括命名分组) # print(m.group()) # m.group() == m.group(0) 匹配到的所有内容,与分组无关 print(m.group(0)) print(m.group(1)) print(m.group(2)) print(m.groupdict())
迭代每个匹配到的整体
groups()取所有分组(包括命名分组)为一个元组
groupdict()取所有命名分组为dict
group()按编号取值(包括命名分组)
都是针对<re.Match object; span(0,6),match='bottle'>对象操作
import re p='''bottle\r\nbag\r\nbig\napple''' regex=re.compile('(b)(\w+)',re.M|re.I) b=regex.match(p) print(b) print(b.groups(),b.group(0),p[b.start():b.end()]) print(b.groupdict())
一个快速取值的方法是b.group()或b.group(0)
import re p='''bottle\r\nbag\r\nbig\napple''' regex=re.compile('(b)(\w+)',re.M|re.I) b=regex.search(p,1) print(b.groups())
指定起始位置
import re p='''bottle\r\nbag\r\nbig\napple''' regex=re.compile(r'(b\w+)\r\n(?P<name1>b\w+)\r\n(?P<name2>b\w+)') b=regex.match(p) print(b) print('''b.group()= {}'''.format(b.group(0))) print(b.groups(),b.group(1),b.group(2),b.group(3)) print(b.groupdict()) print(b.groupdict()['name1']) print(b.groupdict()['name2'])
import re p='''bottle\r\nbag\r\nbig\napple''' regex=re.compile(r'b\w+\r\n(?P<name1>b\w+)\r\n(?P<name2>b\w+)') b=regex.findall(p) print(b) # 只匹配到一个,为分组形成的元组 for m in b[0]: print(type(m),m)
import re p='''bottle\r\nbag\r\nbig\napple''' regex=re.compile(r'(b\w+)\r\n(?P<name1>b\w+)\r\n(?P<name2>b\w+)') b=regex.findall(p) print(b) # 只匹配到一个,为分组形成的元组 for m in b[0]: print(type(m),m)
import re p='''bottle\r\nbag\r\nbig\napple''' regex=re.compile('(?P<head>b\w+)') b=regex.finditer(p) print(b) for m in b: # finditer找到一个匹配,就yield一个re.Match对象 print(type(m),m,m.group(),m.group('head'),m.groupdict()['head'])
import re
p='''bottle\r\nbag\r\nbig\napple'''
regex=re.compile('(b)(\w+)')
b=regex.findall(p)
print(b) # 如果匹配中有分组,则元素为元组,忽略命名分组
for m in b:
print(m)
import re s='''os.path([path]) sub-path''' print(re.split('[^-\w]+',s)) # 将-作为连字符