例如:
string = "This is a link http://www.google.com"
我怎样才能提取“http://www.google.com”?
(每个链接的格式相同,即’http://’)
解决方法:
可能有几种方法可以做到这一点,但最干净的是使用正则表达式
>>> myString = "This is a link http://www.google.com"
>>> print re.search("(?P<url>https?://[^\s]+)", myString).group("url")
http://www.google.com
如果可以有多个链接,您可以使用类似于下面的内容
>>> myString = "These are the links http://www.google.com and https://*.com/questions/839994/extracting-a-url-in-python"
>>> print re.findall(r'(https?://[^\s]+)', myString)
['http://www.google.com', 'https://*.com/questions/839994/extracting-a-url-in-python']
>>>