不期望输出与页面解析
问题描述:
我想解析一个足球统计网站的结果,并建立一个数据库。不期望输出与页面解析
我正在使用jsoup库,并且我有另一个用户昨天为我写的这段代码。
我试图解析的页面是这样的: goalnow
,我使用此代码:
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.*;
import org.jsoup.select.Elements;
public class HTMLParser {
public static void main(String[] args) throws IOException{
String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008";
Document document = Jsoup.connect(url).get();
Elements stats = document.select("#Table3 tbody tr ");
for(int i = 0; i < stats.size(); i++){
System.out.println(stats.get(i).text());
}
}
}
我正在寻找在输出的所有表,但我已经这样:
号日期主队比分客队盘口上/下数据 FT HT FT HT
基本上,第一行。我的代码有什么问题?有人可以帮助我理解如何解析这类数据吗?
答
你的代码是好的,但问题是:该网站使用的JavaScript 为它的内容。不幸的是JSoup不支持JS。
第一行被解析,因为它是常见的Html。顺便说一句。它总是有帮助的检查Jsoup如何看待网站:
String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008";
Document document = Jsoup.connect(url).get();
System.out.println(document);
但是你可以看看我的答案在这里:Trying to parse html hidden by javascript
在那里,我列出了一些JavaScript库,它可以帮助你。