的NSXMLParser可以成为用于分析HTML
问题描述:
可能重复:
Using an NSXMLParser to parse HTML的NSXMLParser可以成为用于分析HTML
我已经使用NSXMLParser
解析XML文件和RSS feeds。我感到困惑的是,NSXMLParser
是否仅适用于xml,或者我们是否也可以使用它来解析html。从互联网上的一些搜索,我假设有人用它来解析html。
但是,使用NSXMLParser
html有什么限制或缺点吗?
答
如果你的HTML文档格式正确,那么它将工作。作为一个猜测,你将不会使用格式良好的xhtml,因为它在现实世界中很少见。
HTML(包括HTML 4和5)格式不正确,不会被XML解析器成功解析。
考虑下面的示例:
<HTML>
<HEAD>
<META http-equiv=content-type content="text/html; charset=UTF-8">
<TITLE>Sample Document</TITLE>
</HEAD>
<BODY>
<H1>Sample Document</h1>
<P>This document will <strong><em>fail</strong></em> as XML.
</BODY>
</HTML>
在上述文献中,内容类型是不是在引号(<META http-equiv=content-type …
),<H1>
和</h1>
是不同的情况下,<P>
没有结束标记,和strong
和em
嵌套不正确。这是有效的HTML,但无效的XML。
(十)HTML是XML,所以是的,它会工作。 –