Android的DOM解析链接标签
问题描述:
下面一个就是我在这个URL解析链接标签Android的DOM解析链接标签
http://www.mobileapp.pcmac.org/mobile/xml/sisapp.asp?sid=353&pn=news2
数据
<item>
<title>DATA WAREHOUSE (Quick link and training information)</title>
<category> News</category>
<description></description>
<pubDate>Tue, 1 Dec 2009 00:00 CST</pubDate>
<enclosure url="" length="0" type="image/jpg" />
**<link>http://www.mcpss.com?PN='News2'&SubP='DNewsStory'&gn=&NewsID=17662&ShowNav=&StoryGroup=Current</link>**
</item>
我是从上解析链接代码的网址data.but当我试图把这个值在下面的代码它抛出以下异常: HTTP错误获取URL
try {
String website=list.get(0);
Document doc = Jsoup.connect(website).get();
Elements el=doc.getElementsByClass("header");
Elements atr= doc.select("p span");
String ss="";
for(Element s:atr)
ss+=s.text();
String text=el.text();
t1.setText(text);
t2.setText(ss);
} catch (Exception e) {
log.d("Error",e.getMessage());
}
如果我硬编码链接值它工作正常。我需要一些帮助来解决这个问题。
答
首先,您需要检查您的解析是否正常工作。所以使用println或类似的。如果网址已被确认,您可以进行下一步操作。
大多数问题发生在重定向。
在您的例子解析链接将是:
http://www.mcpss.com?PN='News2'&SubP='DNewsStory'&gn=&NewsID=17662&ShowNav=&StoryGroup=Current
实际的网站重定向到的是:
http://www.mcpss.com/?PN='News2'&SubP='DNewsStory'&gn=&NewsID=17662&ShowNav=&StoryGroup=Current
你可以看到一个斜线已添加。尝试使用jsoup连接到最终的url。如果这样做比您需要首先解析所有链接并在使用jsoup连接到它之前添加斜杠。如果适用,它应该是所有网址的持续计划。
希望它有助于
非常感谢您的帮助 –