我正在使用以下代码来定位div:
parser = etree.HTMLParser()
tree = etree.parse(StringIO(page), parser)
div = tree.xpath("//div[@class='content']")[0]
我唯一的问题是,在执行此操作后,我不想依赖lxml来提取所述div的内容:我只想获取div包含的原始XML.这是可行的还是我必须完全放弃这种方法?
解决方法:
我想你正在寻找:
etree.tostring(div)