python – 使用lxml获取HTML的所有链接

我想使用lxml从html页面中找出所有url及其名称.

我可以解析网址,可以找到这个东西,但有没有简单的方法,我可以找到使用lxml的所有网址链接?

解决方法:

from lxml.html import parse
dom = parse('http://www.google.com/').getroot()
links = dom.cssselect('a')
上一篇:python – 从XML文档中获取所有文本?


下一篇:python – lxml通过regex查找标签