用于非xml的DOM解析器

问题描述：

我想分析以下类型的文本。例1 <root>my name is <j> <b> mike</b> </j> </root>用于非xml的DOM解析器

例如使用DOM解析器是2

<root> my name is <mytag1 attribute="val" >mike</mytag1> and yours is <mytag2> john</mytag2> </root>

我可以解析？我不会有相同的格式埃夫里的时间。我可以有不同的格式，其中标签nested.I不知道格式提前。

答

您可以使用DOM解析器来处理您提供的示例 - 它们是有效的XML。但是，根据您的主题行，您将无法将其用于非XML。

当你说你可以有“嵌套标签的不同格式”，你究竟是什么意思？如果它总是嵌套，例如简单

<root> 
    <tag1> 
    <tag2> 
     <tag3> 
     Stuff 
     </tag3> 
    </tag2> 
    </tag1> 
</root>

那就没事了。做T这样，所以没有理由可以

<root> 
    <tag1> 
    <tag2> 
     Stuff 
    </tag1> <!-- Invalid --> 
    </tag2> 
</root>

答

两个例子都是有效的XML文档：然而，XML解析器会不喜欢的标记，其中的“外部”标签前的“内部”一个封闭。

如果您的XML非常简单，特别是如果它将文本和标签组合在一起，您可能首先需要通过XSL transformation来运行它，以便更容易地解析或转换为其他格式，如HTML。