我想使用lxml从html页面中找出所有url及其名称.
我可以解析网址,可以找到这个东西,但有没有简单的方法,我可以找到使用lxml的所有网址链接?
解决方法:
from lxml.html import parse
dom = parse('http://www.google.com/').getroot()
links = dom.cssselect('a')
2023-08-22 23:01:34
我想使用lxml从html页面中找出所有url及其名称.
我可以解析网址,可以找到这个东西,但有没有简单的方法,我可以找到使用lxml的所有网址链接?
解决方法:
from lxml.html import parse
dom = parse('http://www.google.com/').getroot()
links = dom.cssselect('a')