解析HTML使用HTTP敏捷性包
问题描述:
这里是一个表,满分5:解析HTML使用HTTP敏捷性包
<h3>marec - maj 2009</h3>
<div class="graf_table">
<table summary="layout table">
<tr>
<th>DATUM</th>
<td class="datum">10.03.2009</td>
<td class="datum">24.03.2009</td>
<td class="datum">07.04.2009</td>
<td class="datum">21.04.2009</td>
<td class="datum">05.05.2009</td>
<td class="datum">06.05.2009</td>
</tr>
<tr>
<th>Maloprodajna cena [EUR/L]</th>
<td>0,96000</td>
<td>0,97000</td>
<td>0,99600</td>
<td>1,00800</td>
<td>1,00800</td>
<td>1,01000</td>
</tr>
<tr>
<th>Maloprodajna cena [SIT/L]</th>
<td>230,054</td>
<td>232,451</td>
<td>238,681</td>
<td>241,557</td>
<td>241,557</td>
<td>242,036</td>
</tr>
<tr>
<th>Prodajna cena brez dajatev</th>
<td>0,33795</td>
<td>0,34628</td>
<td>0,36795</td>
<td>0,37795</td>
<td>0,37795</td>
<td>0,37962</td>
</tr>
<tr>
<th>Trošarina</th>
<td>0,46205</td>
<td>0,46205</td>
<td>0,46205</td>
<td>0,46205</td>
<td>0,46205</td>
<td>0,46205</td>
</tr>
<tr>
<th>DDV</th>
<td>0,16000</td>
<td>0,16167</td>
<td>0,16600</td>
<td>0,16800</td>
<td>0,16800</td>
<td>0,16833</td>
</tr>
</table>
</div>
我要提取出值,其中表头是DATUM和Maloprodajna以上的价格[EUR/L]。 我正在使用Agility HTML包。
this.htmlDoc = new HtmlAgilityPack.HtmlDocument();
this.htmlDoc.OptionCheckSyntax = true;
this.htmlDoc.OptionFixNestedTags = true;
this.htmlDoc.OptionAutoCloseOnEnd = true;
this.htmlDoc.OptionOutputAsXml = true; // is this necessary ??
this.htmlDoc.OptionDefaultStreamEncoding = System.Text.Encoding.Default;
我把这些数值拿出来有很多麻烦。 我开始:
var query = from html in doc.DocumentNode.SelectNodes("//div[@class='graf_table']").Cast<HtmlNode>()
from table in html.SelectNodes("//table").Cast<HtmlNode>()
from row in table.SelectNodes("tr").Cast<HtmlNode>()
from cell in row.SelectNodes("th|td").Cast<HtmlNode>()
select new { Table = table.Id, CellText = cell.InnerHtml };
但不能想出一个办法来选择仅在表头的数据和Maloprodajna以上的价格[EUR/L]值。用where子句可以做到吗?
然后,我与这两个查询结束:
var date = (from d in htmlDoc.DocumentNode.SelectNodes("//div[@class='graf_table']//table//tr[1]/td")
select DateTime.Parse(d.InnerText)).ToArray();
var price = (from p in htmlDoc.DocumentNode.SelectNodes("//div[@class='graf_table']//table//tr[2]/td")
select double.Parse(p.InnerText)).ToArray();
是否有可能这两个查询组合? 如何将其转换为lambda表达式? 我刚开始学习这些东西,我想知道它是如何做的,以便将来我不会有这些问题。
O,还有一个问题......是否有人知道任何图形控件,因为我必须在图中显示这些值。 我开始使用Microsoft Chart Controls,但我在设置时遇到问题。 所以,如果任何人有任何经验,我想知道如何设置它,以便x轴将显示所有值不是每秒...例如: 如果我有:10.03.2009,24.03.2009,07.04。 2009年,21.04.2009,05.05.2009,06.05.2009 它只显示:10.03.2009,07.04.2009,05.05.2009,等。
我将数据绑定到图表那样:
chart1.Series["Series1"].Points.DataBindXY(date, price);
我很多我的拳头后的问题...呵呵,希望我不是模糊不清或东西。 感谢您的回复!
答
对于这样的CodePlex项目,请考虑直接发布您的问题到他们的讨论板上。通常这是联系开发人员的最佳方式。