上一篇:模块的使用| 手把手教你入门Python之八十三
下一篇:正则查找相关的方法 | 手把手教你入门Python之八十五
本文来自于千锋教育在阿里云开发者社区学习中心上线课程《Python入门2020最新大课》,主讲人姜伟。
正则表达式
正则表达式是⼀个特殊的字符序列,计算机科学的⼀个概念。通常被⽤来检索、替换那些符合某个模式(规则)的⽂本。
许多程序设计语⾔都⽀持利⽤正则表达式进⾏字符串操作。在Python中需要通过正则表达式对字符串进⾏匹配的时候,可以使⽤re模块。re 模块使 Python 语⾔拥有全部的正则表达式功能。
特点:
- 灵活性、逻辑性和功能性⾮常强;
- 可以迅速地⽤极简单的⽅式达到字符串的复杂控制。
- 对于刚接触的⼈来说,⽐较晦涩难懂。
Python中的正则表达式
与⼤多数编程语⾔相同,正则表达式⾥也使⽤ \
作为转义字符,这就可能造成反斜杠困扰。假如你需要匹配⽂本中的字符 \
,那么使⽤编程语⾔表示的正则表达式⾥将需要4个反斜杠 \
:前两个和后两个分别⽤于在编程语⾔⾥转义成反斜杠,转换成两个反斜杠后再在正则表达式⾥转义成⼀个反斜杠。
第一个参数就是正则匹配规则,第二个参数表示需要匹配的字符串。
print(re.match('\\\\', '\hello')) # 需要使⽤四个反斜杠来匹配⼀个 \
Python⾥的原⽣字符串很好地解决了这个问题,有了原⽣字符串,你再也不⽤担⼼是不是漏写了反斜杠,写出来的表达式也更直观。在Python 字符串前⾯添加 r
即可将字符串转换成为原⽣字符串。
print(re.match(r'\\', '\hello')) # 使⽤两个反斜杠即可匹配⼀个 \