使用Python刮* .aspx内容

问题描述:

我在ASPX中动态生成表时遇到困难。试图从这样的网站上剔除天然气价格GasPrices。我可以提取天然气价格表中的所有信息(地址,提交时间等),但实际天然气价格除外。使用Python刮* .aspx内容

有没有一种方法可以削减汽油价格?即以某种方式得到它的文本表示。我对ASP/ASPX不是很熟悉,但是现在生成的东西并没有在最终的HTML中显示出来。我使用Python做刮擦,但这是无关的,除非有一个特定的库...

在此先感谢。

+0

天然气价格是多少?那是什么链接? – ash 2010-04-29 23:38:13

+0

哎呀。错误的链接。固定。 – tomato 2010-04-29 23:39:14

+0

http://*.com/questions/2741420/scraping-aspx-content-using-python – 2010-04-29 23:54:40

页面的起源(aspx)在这里不是问题。

看起来他们正在积极尝试阻止刮蹭尝试。这些数字不是字体,而是他们的几个div元素,其中background images是数字。 他们真的不想被刮。

(当然,如果你真的确定你很可能映射类名的div来......他们并不是很好“加密”)

拿笔记的版权通知在链接页面的底部

+0

可能的重复同意,他们用图像编码他们的价格的事实表明他们不想被刮。你应该尊重这一点。 – 2010-04-29 23:52:12

+0

绝对会尊重那个。谢谢。 – tomato 2010-04-30 00:20:34