python常用操作

python字符串-原始字符串

r'c:\windows' #前面加r之后后边的字符串转化为原始字符串,其中的\不会当做转义字符处理,这个r可以小写,也可以大写,效果是一样的

python切片操作

'Hello world'[0]	# H
'Hello world'[4]	# o
'Hello world'[-1]	# d
# 切片的时候,切的是从开始位置到结束位置的前一位
'Hello world'[0:4]	# Hell
'Hello world'[0:5]	# Hello
'Hello world'[0:-1]	# Hello worl
'Hello world'[6:] # world

正则表达式

import re
a = 'C|4C++|Java|1C#|Python|2Javascript'
# 检索普通字符
re.findall('Python', a) # ['Python']
# 检索所有的数字(元字符)
re.findall('\d', a) # ['4','1','2']
# 检索所有的非数字
re.findall('\D',a) # ['C','|','C','+','+','J','a','v','a','|','C','#',.......]
s='abc,acc,adc,aec,afc,ahc'
# 匹配中间是c或f的单词
r = re.findall('a[cf]c', s) # ['acc','afc']
# 匹配中间不是c或f的单词
r = re.findall('a[^cf]c', s) # ['abc','adc','aec','ahc']
# 匹配中间范围在c~f的单词
r = re.findall('a[c-f]c', s) # ['acc','adc','aec','afc']

概括字符集

\d 数字
\D 非数字
\w 单词:0-9a-zA-Z_
\W 非单词字符:& ’ ’ \n \r \t
\s 空白字符:换行、空格、制表
\S 非空白字符

数量词的使用

a = 'python 11111java234php'
# 匹配找出所有的单词 {3,6}3表示最少3个,6表示最多6个
r = re.findall('[a-z]{3,6}', a)	#['python','java','php']

上一篇:一直爬虫的自我修养 正则!


下一篇:python正则表达式匹配指定的字符开头和指定的字符结束