刮网页内容

刮网页内容

问题描述:

我刚开始研究这个,我想刮我的Netgear路由器(http://192.168.0.1/setup.cgi?next_file=stattbl.htm)统计成一个csv文件。刮网页内容

我运行Win & Linux,但主要知道C++,任何链接/解决方案?

我知道并写了C++,但对于屏幕抓取,我宁愿使用一些脚本语言,如Python与一些方便的库,例如, http://www.crummy.com/software/BeautifulSoup/

特别是在linux上,python应该已经安装(或者至少可以通过软件包管理器轻松安装)。

由于MYYN建议,像BeautifulSoupHpricot的确有过人之处,在这样的事情,所以如果你不完全相信,它必须是在C++中,你真应该看看那些(既蟒蛇的基本知识和红宝石可以很快拾起并且肯定比C++简单)。或者,查看QTDOMDocumentTinyXML++

+0

你和MYYN都是优秀的答案/信息,但我必须将其中一个标记为Accepted,对不起,它不是你的! – 2011-01-26 07:29:34