假设我想用以下XML解析一个lxml xpath表达式
<pack xmlns="http://ns.qubic.tv/2010/item">
<packitem>
<duration>520</duration>
<max_count>14</max_count>
</packitem>
<packitem>
<duration>12</duration>
</packitem>
</pack>
这是在http://python-thoughts.blogspot.fr/2012/01/default-value-for-text-function-using.html可以找到的变化
我如何实现对不同元素的解析,这将使我一经压缩(在zip或izip python函数意义上)
[(520,14),(12,None)]
?
第二个packitem中缺少的max_count标记使我无法获得所需的东西.
解决方法:
def lxml_empty_str(context, nodes):
for node in nodes:
node.text = node.text or ""
return nodes
ns = etree.FunctionNamespace('http://ns.qubic.tv/lxmlfunctions')
ns['lxml_empty_str'] = lxml_empty_str
namespaces = {'i':"http://ns.qubic.tv/2010/item",
'f': "http://ns.qubic.tv/lxmlfunctions"}
packitems_duration = root.xpath('f:lxml_empty_str('//b:pack/i:packitem/i:duration)/text()',
namespaces={'b':billing_ns, 'f' : 'http://ns.qubic.tv/lxmlfunctions'})
packitems_max_count = root.xpath('f:lxml_empty_str('//b:pack/i:packitem/i:max_count) /text()',
namespaces={'b':billing_ns, 'f' : 'http://ns.qubic.tv/lxmlfunctions'})
packitems = zip(packitems_duration, packitems_max_count)
>>> packitems
[('520','14'), ('','23')]
http://python-thoughts.blogspot.fr/2012/01/default-value-for-text-function-using.html