不期望输出与页面解析

问题描述:

我想解析一个足球统计网站的结果,并建立一个数据库。不期望输出与页面解析

我正在使用jsoup库,并且我有另一个用户昨天为我写的这段代码。

我试图解析的页面是这样的: goalnow

,我使用此代码:

import java.io.IOException; 
import org.jsoup.Jsoup; 
import org.jsoup.nodes.*; 
import org.jsoup.select.Elements; 

public class HTMLParser { 

public static void main(String[] args) throws IOException{ 
String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008"; 
Document document = Jsoup.connect(url).get(); 

Elements stats = document.select("#Table3 tbody tr "); 

for(int i = 0; i < stats.size(); i++){ 
    System.out.println(stats.get(i).text()); 
} 

    } 
} 

我正在寻找在输出的所有表,但我已经这样:

号日期主队比分客队盘口上/下数据 FT HT FT HT

基本上,第一行。我的代码有什么问题?有人可以帮助我理解如何解析这类数据吗?

你的代码是好的,但问题是:该网站使用的JavaScript 它的内容。不幸的是JSoup不支持JS。

第一行被解析,因为它是常见的Html。顺便说一句。它总是有帮助的检查Jsoup如何看待网站:

String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008"; 
Document document = Jsoup.connect(url).get(); 

System.out.println(document); 

但是你可以看看我的答案在这里:Trying to parse html hidden by javascript

在那里,我列出了一些JavaScript库,它可以帮助你。