1. 笔记的学习视频来源:
- https://www.bilibili.com/video/BV1pt41137qK?p=39
2. Re库默认采用贪婪匹配
虽然’PY.*N’匹配字符串’PY1N22N33N’ 可以得到 PY1N, PY1N22N, PY1N22N33N,但是Re库默认采用贪婪匹配,即输出最长的字符串PY1N22N33N
"""
# 特别字符 * 表示匹配前面的子表达式零次或多次
# 特别字符 . 匹配除换行符 \n 之外的任何单字符
# PY.*N 表示匹配PY开头N结尾的字符串
"""
match = re.search(r'PY.*N', 'PY1N22N33N')
# 虽然'PY.*N'匹配字符串'PY1N22N33N' 可以得到 PY1N, PY1N22N, PY1N22N33N
# 但是Re库默认采用贪婪匹配,即输出最长的字符串,故输出结果为 PY1N22N33N
print(match.group(0))
3. 最小匹配
操作符 | 说明 |
---|---|
*? | 前一个字符串0次或无限次拓展的最小匹配 |
+? | 前一个字符串1次或无限次拓展的最小匹配 |
?? | 前一个字符串0次或1次拓展的最小匹配 |
{m, n} | 拓展前一个字符串m至n(含n)的最小匹配 |
# 如果想要得到最短字符串可以使用操作符 *?,即加一个问号?
match = re.search(r'PY.*?N', 'PY1N22N33N')
# 最小匹配的输出结果
print(match.group(0))
4. 运行示例
4.1 代码
import requests
from bs4 import BeautifulSoup
import bs4
import re
"""
学习笔记:Re 库的贪婪匹配和最小匹配
笔记的学习视频来源:
https://www.bilibili.com/video/BV1pt41137qK?p=39
最小匹配操作符
操作符 说明
*? 前一个字符串0次或无限次拓展的最小匹配
+? 前一个字符串1次或无限次拓展的最小匹配
?? 前一个字符串0次或1次拓展的最小匹配
{m, n} 拓展前一个字符串m至n(含n)的最小匹配
"""
if __name__ == '__main__':
"""
# 特别字符 * 表示匹配前面的子表达式零次或多次
# 特别字符 . 匹配除换行符 \n 之外的任何单字符
# PY.*N 表示匹配PY开头N结尾的字符串
"""
match = re.search(r'PY.*N', 'PY1N22N33N')
# 虽然'PY.*N'匹配字符串'PY1N22N33N' 可以得到 PY1N, PY1N22N, PY1N22N33N
# 但是Re库默认采用贪婪匹配,即输出最长的字符串,故输出结果为 PY1N22N33N
print(match.group(0))
# 如果想要得到最短字符串可以使用操作符 *?,即加一个问号?
match = re.search(r'PY.*?N', 'PY1N22N33N')
# 最小匹配的输出结果
print(match.group(0))
4.2 运行结果
C:\Users\珞落\AppData\Local\Programs\Python\Python39\python.exe D:/PythonProject/main.py
PY1N22N33N
PY1N
Process finished with exit code 0