的NSXMLParser可以成为用于分析HTML

问题描述:

可能重复:
Using an NSXMLParser to parse HTML的NSXMLParser可以成为用于分析HTML

我已经使用NSXMLParser解析XML文件和RSS feeds。我感到困惑的是,NSXMLParser是否仅适用于xml,或者我们是否也可以使用它来解析html。从互联网上的一些搜索,我假设有人用它来解析html。

但是,使用NSXMLParser html有什么限制或缺点吗?

+0

(十)HTML是XML,所以是的,它会工作。 –

如果你的HTML文档格式正确,那么它将工作。作为一个猜测,你将不会使用格式良好的xhtml,因为它在现实世界中很少见。

HTML(包括HTML 4和5)格式不正确,不会被XML解析器成功解析。

考虑下面的示例:

<HTML> 
<HEAD> 
<META http-equiv=content-type content="text/html; charset=UTF-8"> 
<TITLE>Sample Document</TITLE> 
</HEAD> 
<BODY> 
<H1>Sample Document</h1> 
<P>This document will <strong><em>fail</strong></em> as XML. 
</BODY> 
</HTML> 

在上述文献中,内容类型是不是在引号(<META http-equiv=content-type …),<H1></h1>是不同的情况下,<P>没有结束标记,和strongem嵌套不正确。这是有效的HTML,但无效的XML。