[XPath/Python] XPath 与 lxml (五)XPath 实例

本文继续沿用第三章的 XML 示例文档。

 

选取价格高于30的 price 节点

# 从父节点进行筛选
>>> root.xpath(//book[price>30]/price)
[<Element price at 0x2d888c8>]

# 直接对 price 进行筛选
>>> root.xpath(//price[text()>30])
[<Element price at 0x2d888c8>]

 

选取 price 高于 30 的 title 节点

# 从父节点开始选取
>>> root.xpath(//book[price>30]/title)
[<Element title at 0x2d88878>]

# 从节点本身选取
>>> root.xpath(//price[text()>30]//preceding-sibling::title|following-sibling::title)
[<Element title at 0x2d88878>]

# 从 price 到父节点选取
>>> root.xpath(//price[text()>30]//parent::*/title)
[<Element title at 0x2d88878>]

 

处理命名空间

>>> xml = """<?xml version="1.0" encoding="utf8"?>
<bookstore xmlns:a="http://www.google.com">
    <a:book>
        <title lang="eng">Harry Potter</title>
        <price>29.99</price>
    </a:book>
    <book>
        <title lang="eng">Learning XML</title>
        <price>39.95</price>
    </book>
</bookstore>"""

# 获取根节点
>>> root = etree.fromstring(xml)

# 选取不带命名空间的 book 元素
>>> root.xpath(//book)
[<Element book at 0x2d88940>]

# 选取所有的 book 元素,无论是否含有命名空间
# 其中 namespace 参数为一个字典对象,映射了命名空间前缀,本例中直接使用了文档原有的命名空间与前缀。
>>> root.xpath(//a:book|//book, namespaces=root.nsmap)
[<Element {http://www.google.com}book at 0x2d88878>, <Element book at 0x2d88940>]

[XPath/Python] XPath 与 lxml (五)XPath 实例,布布扣,bubuko.com

[XPath/Python] XPath 与 lxml (五)XPath 实例

上一篇:Jump Game leetcode java


下一篇:Longest Substring Without Repeating Characters leetcode java