我正在使用lxml,我正在尝试获取原始的xml字符串,所以:
>>> elem = etree.fromstring("<tag>áéíóúñü</tag>")
>>> etree.tostring(elem)
b'<tag>áéíóúñü</tag>'
我发现获取原始字符串的唯一方法是:
>>> etree.tostring(elem, encoding = "utf-8").decode("utf-8")
'<tag>áéíóúñü</tag>'
有更好的方法吗?
解决方法:
这个怎么样:
In [31]: elem = etree.fromstring("<tag>❄</tag>")
In [32]: etree.tostring(elem, encoding=str)
Out[32]: '<tag>❄</tag>'