-
import requests, re
#regex = r"([a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)"
#这个正则表达式过滤掉了qq邮箱
regex = r"([a-zA-Z0-9_.+-]+@[a-pr-zA-PRZ0-9-]+\.[a-zA-Z0-9-.]+)"
#基于隐私,使用了“XXXXXXXXXXXXXX”
url = 'http://blog.sina.com.cn/s/XXXXXXXXXXXXXXXXXX.html'
html = requests.get(url).text
#print(html)
emails = re.findall(regex,html)
i = 0
for email in emails:
i += 1
if i < 16:
print("{} :{}".format(i,email))
相关文章
- 12-13python中时间对象生成及时间格式的转换
- 12-13Python中的r+和a+
- 12-13Python中的isinstance函数
- 12-13python中的str.strip()的用法
- 12-13Python中定义函数时参数有默认值的小陷阱
- 12-13python中字符串(str)的常用处理方法
- 12-13Python中的CAC客户端应用程序验证
- 12-13python函数参数中带有默认参数list的坑
- 12-13Python中的迭代是什么意思?
- 12-13python中的迭代器 生成器 装饰器