在dom解析器中解析html数字,如“&#189” - android
问题描述:
我正在开发一个android项目。我正在使用dom解析器来解析xml文件。问题是我的XML文件中包含的html号码,如&#189(分号会在每一个字符代码结束)在dom解析器中解析html数字,如“&#189” - android
例如
<quote>We “love” our nation</quote>
这不过是
<quot>We "love" our nation</quote>
我无法在dom解析中解析这个html数字,当我尝试获取节点值时,我得到空值。
任何人都可以告诉我如何解析这个html字符代码?
或
如何这个网站字符代码转换为我的XML进料将是文本字符代码或Unicode字符?
答
我已经使用xmlpullparser。它的工作现在很好。 :)
答
有一个非常类似的问题在这里:Android decoding html in xml file
看来HTML字符打破DOM解析器,所以无法从XML实体的字符串。
有一个HTML功能将字符串中的解析HTML:
TextView tv = (TextView) findViewById(R.id.tv);
String s = <quote>We “love” our nation</quote>";
tv.setText(Html.fromHtml(s));
输出:
我们 “爱” 我们国家
但是它似乎是DOM ISN”吨得到的字符串转换,所以下面的文章可能有用:Using XPATH and HTML Cleaner to parse HTML/XML
嗨感谢您的答复。你给的链接很有用。 – Padma 2010-11-09 14:13:36