使用JSoup提取HTML表格内容
问题描述:
如何提取位于以下位置的表格内容: /id/2/year/2012/acc-conference">http://espn.go.com/mens-college - 篮球/会议/积分榜// id/2/year/2012/acc-conference使用JSoup提取HTML表格内容
我看到的几个例子并不太清楚如何获取表格的内容。任何人都可以提供任何帮助?
答
你现在可能已经解决了这个问题,但是这将会遍历每个表格并打印出团队名称和Win/Loss列,调整你需要的信息第二个表格显然格式不同,所以如果您需要该表中的不同信息,则需要进一步调整。让我知道你是否需要任何帮助。
Document doc = Jsoup.connect("http://espn.go.com/mens-college-basketball/conferences/standings/_/id/2/year/2012/acc-conference").get();
for (Element table : doc.select("table.tablehead")) {
for (Element row : table.select("tr")) {
Elements tds = row.select("td");
if (tds.size() > 6) {
System.out.println(tds.get(0).text() + ":" + tds.get(1).text());
}
}
}
+0
'Elements'是一个打错'Element' –
+1
@DonLarynx答案没有错误。 – Stephan
'http:// espn.go.com/mens-college-basketball/meetings/byings // id/2/year/2012/acc-conference'返回404找不到错误:URL你所要求的不存在,但你可能对下面的内容感兴趣。你确定这是正确的网址吗? –
这是错误的网址,它是:http://espn.go.com/mens-college-basketball/conferences/standings/_/id/2/year/2012/acc-conference –