在dom解析器中解析html数字,如“&#189” - android

问题描述:

我正在开发一个android项目。我正在使用dom解析器来解析xml文件。问题是我的XML文件中包含的html号码,如&#189(分号会在每一个字符代码结束)在dom解析器中解析html数字,如“&#189” - android

例如

<quote>We &#8220;love&#8221; our nation</quote> 

这不过是

<quot>We "love" our nation</quote> 

我无法在dom解析中解析这个html数字,当我尝试获取节点值时,我得到空值。

任何人都可以告诉我如何解析这个html字符代码?

如何这个网站字符代码转换为我的XML进料将是文本字符代码或Unicode字符?

我已经使用xmlpullparser。它的工作现在很好。 :)

有一个非常类似的问题在这里:Android decoding html in xml file

看来HTML字符打破DOM解析器,所以无法从XML实体的字符串。

有一个HTML功能将字符串中的解析HTML:

TextView tv = (TextView) findViewById(R.id.tv); 
String s = <quote>We &#8220;love&#8221; our nation</quote>"; 
tv.setText(Html.fromHtml(s)); 

输出:

我们 “爱” 我们国家

但是它似乎是DOM ISN”吨得到的字符串转换,所以下面的文章可能有用:Using XPATH and HTML Cleaner to parse HTML/XML

+0

嗨感谢您的答复。你给的链接很有用。 – Padma 2010-11-09 14:13:36