如何删除文本内容中的固定XML标签?
问题描述:
我在XML文件的内容:如何删除文本内容中的固定XML标签?
Hello
<Images>
<URL>google</URL>
</Images>
<Reviews>
Good
</Reviews>
everybody,
<Images>
<URL>bing</URL>
</Images>
<Reviews>
Good
</Reviews>
I am Nguyen
输出:
Hello everybody, I am Nguyen
如何删除<Images>
和</Reviews>
之间的内容。
上面的示例数据很小。其实,我有一个大数据。
答
您可以用一个空格替换(?:\s*<(Images|Reviews)>.+?</\1>\s*)+
。如果您使用的正则表达式不支持点全部(代表全部个字符的点(包括换行符)),则必须使其更复杂一点:适用于JavaScript。
+0
非常感谢!太好了!有用 ! :d – 2013-04-05 01:07:06
正如前面所说[在此之前](http://*.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454),您应该_not_尝试使用正则表达式解析XML或HTML。你会惨败的。相反,使用XML解析器。 – 2013-04-04 16:09:51
@RobI你说错了,不是'你会失败',而是'你可能会失败';)如果内容足够静态,你可以使用正则表达式。我曾经在一些数据文件中做过。但是,当然你必须确定你正在使用的内容。 – 2013-04-04 16:11:31