有一个xml文件:
<body>
<entry>
I go to <hw>to</hw> to school.
</entry>
</body>
由于某些原因,我更改了< hw>到< hw& gt;和< / hw>到& lt; / hw& gt;在使用lxml解析器进行解析之前.
<body>
<entry>
I go to <hw>to</hw> to school.
</entry>
</body>
但是在修改了解析的xml数据之后,我想获得一个< hw>元素,而不是< hw& gt;.我怎样才能做到这一点?
解决方法:
首先找到一个unescape函数:
from xml.sax.saxutils import unescape
entry=body[0]
取消转义并替换为原来的:
body.replace(entry, e.fromstring(unescape(e.tounicode(entry))))