如何转换<变成<在lxml中,Python吗?

有一个xml文件:

<body>
    <entry>
         I go to <hw>to</hw> to school.
    </entry>
</body>

由于某些原因,我更改了< hw>到< hw& gt;和< / hw>到& lt; / hw& gt;在使用lxml解析器进行解析之前.

<body>
    <entry>
         I go to &lt;hw&gt;to&lt;/hw&gt; to school.
    </entry>
</body>

但是在修改了解析的xml数据之后,我想获得一个< hw>元素,而不是< hw& gt;.我怎样才能做到这一点?

解决方法:

首先找到一个unescape函数:

from xml.sax.saxutils import unescape

entry=body[0]

取消转义并替换为原来的:

body.replace(entry, e.fromstring(unescape(e.tounicode(entry))))
上一篇:python-lxml:就地修改树


下一篇:像使用C#读取python的lxml一样读取XML文件吗?