如何使用python从字符串中提取url?

例如:

string = "This is a link http://www.google.com"

我怎样才能提取“http://www.google.com”?

(每个链接的格式相同,即’http://’)

解决方法:

可能有几种方法可以做到这一点,但最干净的是使用正则表达式

>>> myString = "This is a link http://www.google.com"
>>> print re.search("(?P<url>https?://[^\s]+)", myString).group("url")
http://www.google.com

如果可以有多个链接,您可以使用类似于下面的内容

>>> myString = "These are the links http://www.google.com  and https://*.com/questions/839994/extracting-a-url-in-python"
>>> print re.findall(r'(https?://[^\s]+)', myString)
['http://www.google.com', 'https://*.com/questions/839994/extracting-a-url-in-python']
>>> 
上一篇:从zip中提取文件而不使用python ZipFile保留结构?


下一篇:webpack高版本抽离css样式报错[已解决]