使用lxml tostring()获取原始字符串

我正在使用lxml,我正在尝试获取原始的xml字符串,所以:

>>> elem = etree.fromstring("<tag>áéíóúñü</tag>")
>>> etree.tostring(elem)
b'<tag>&#225;&#233;&#237;&#243;&#250;&#241;&#252;</tag>'

我发现获取原始字符串的唯一方法是:

>>> etree.tostring(elem, encoding = "utf-8").decode("utf-8")
'<tag>áéíóúñü</tag>'

有更好的方法吗?

解决方法:

这个怎么样:

In [31]: elem = etree.fromstring("<tag>❄</tag>")

In [32]: etree.tostring(elem, encoding=str)
Out[32]: '<tag>❄</tag>'
上一篇:python – 构建XML文档结构的图形


下一篇:如何使用lxml解析包含前缀但没有名称空间声明的XML?