如何使用正则表达式从python中删除字符串中的标签? (不是HTML)

我需要从python中的字符串中删除标签.

<FNT name="Century Schoolbook" size="22">Title</FNT>

删除两端的整个标记的最有效方法是什么,只留下“标题”?我只看到过使用HTML标签做到这一点的方法,而这在python中对我没用.我正在使用这个特别适用于GIS程序ArcMap.它有自己的布局元素标签,我只需删除两个特定标题文本元素的标签.我相信正则表达式应该可以正常使用,但我对任何其他建议持开放态度.

解决方法:

这应该工作:

import re
re.sub('<[^>]*>', '', mystring)

对于每个人说正则表达式不是正确的工具:

问题的背景是关于常规/无上下文语言的所有异议都是无效的.他的语言基本上由三个实体组成:a =<,b =>和c = [^><].他想删除任何acb.这直接将他的问题描述为涉及无上下文语法的问题,并且将其定性为常规语法并不困难. 我知道每个人都喜欢“你不能用正则表达式解析HTML”的答案,但是OP不想解析它,他只是想进行简单的转换.

上一篇:如何使用python脚本在单引号内提取字符串


下一篇:如何从字符串中删除特定的单词?