学习笔记:Re 库的贪婪匹配和最小匹配

1. 笔记的学习视频来源:

  • https://www.bilibili.com/video/BV1pt41137qK?p=39

2. Re库默认采用贪婪匹配

虽然’PY.*N’匹配字符串’PY1N22N33N’ 可以得到 PY1N, PY1N22N, PY1N22N33N,但是Re库默认采用贪婪匹配,即输出最长的字符串PY1N22N33N

    """
    # 特别字符 * 表示匹配前面的子表达式零次或多次
    # 特别字符 . 	匹配除换行符 \n 之外的任何单字符
    # PY.*N 表示匹配PY开头N结尾的字符串
    """
    match = re.search(r'PY.*N', 'PY1N22N33N')
    # 虽然'PY.*N'匹配字符串'PY1N22N33N' 可以得到 PY1N, PY1N22N, PY1N22N33N
    # 但是Re库默认采用贪婪匹配,即输出最长的字符串,故输出结果为 PY1N22N33N
    print(match.group(0))

3. 最小匹配

操作符 说明
*? 前一个字符串0次或无限次拓展的最小匹配
+? 前一个字符串1次或无限次拓展的最小匹配
?? 前一个字符串0次或1次拓展的最小匹配
{m, n} 拓展前一个字符串m至n(含n)的最小匹配
    # 如果想要得到最短字符串可以使用操作符 *?,即加一个问号?
    match = re.search(r'PY.*?N', 'PY1N22N33N')
    # 最小匹配的输出结果
    print(match.group(0))

4. 运行示例

4.1 代码

import requests
from bs4 import BeautifulSoup
import bs4
import re

"""
学习笔记:Re 库的贪婪匹配和最小匹配

笔记的学习视频来源:
https://www.bilibili.com/video/BV1pt41137qK?p=39

最小匹配操作符
操作符    说明
*?      前一个字符串0次或无限次拓展的最小匹配
+?      前一个字符串1次或无限次拓展的最小匹配
??      前一个字符串0次或1次拓展的最小匹配
{m, n}   拓展前一个字符串m至n(含n)的最小匹配
"""


if __name__ == '__main__':
    """
    # 特别字符 * 表示匹配前面的子表达式零次或多次
    # 特别字符 . 	匹配除换行符 \n 之外的任何单字符
    # PY.*N 表示匹配PY开头N结尾的字符串
    """
    match = re.search(r'PY.*N', 'PY1N22N33N')
    # 虽然'PY.*N'匹配字符串'PY1N22N33N' 可以得到 PY1N, PY1N22N, PY1N22N33N
    # 但是Re库默认采用贪婪匹配,即输出最长的字符串,故输出结果为 PY1N22N33N
    print(match.group(0))

    # 如果想要得到最短字符串可以使用操作符 *?,即加一个问号?
    match = re.search(r'PY.*?N', 'PY1N22N33N')
    # 最小匹配的输出结果
    print(match.group(0))

4.2 运行结果

C:\Users\珞落\AppData\Local\Programs\Python\Python39\python.exe D:/PythonProject/main.py
PY1N22N33N
PY1N

Process finished with exit code 0

上一篇:一个操作系统的实现笔记:利用内存的大小设置页表的个数


下一篇:python re 的使用