用于非xml的DOM解析器
问题描述:
我想分析以下类型的文本。例1 <root>my name is <j> <b> mike</b> </j> </root>
用于非xml的DOM解析器
例如使用DOM解析器是2
<root> my name is <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root>
我可以解析?我不会有相同的格式埃夫里的时间。我可以有不同的格式,其中标签nested.I不知道格式提前。
答
您可以使用DOM解析器来处理您提供的示例 - 它们是有效的XML。但是,根据您的主题行,您将无法将其用于非XML。
当你说你可以有“嵌套标签的不同格式”,你究竟是什么意思?如果它总是嵌套,例如简单
<root>
<tag1>
<tag2>
<tag3>
Stuff
</tag3>
</tag2>
</tag1>
</root>
那就没事了。做T这样,所以没有理由可以
<root>
<tag1>
<tag2>
Stuff
</tag1> <!-- Invalid -->
</tag2>
</root>
答
两个例子都是有效的XML文档:然而,XML解析器会不喜欢的标记,其中的“外部”标签前的“内部”一个封闭。
如果您的XML非常简单,特别是如果它将文本和标签组合在一起,您可能首先需要通过XSL transformation来运行它,以便更容易地解析或转换为其他格式,如HTML。