查找文件在HTML页面中的链接并自动下载文件

问题描述:

我必须在几个网页中下载数百个由“< a href:”FileUrl“.../>”表示的文件。我试图用.NET Webbrowser控件创建一个.NET程序,打开一个URL(包含链接的页面),提取文档的源代码,找到链接... 所有这一切都是让人pe目结舌的,不是问题。查找文件在HTML页面中的链接并自动下载文件

现在,一旦我找到了一个链接,我指示web浏览器导航到该文件的链接,我提出了一个对话框,保存文件(或打开)等

一个或两个文件很好。对于数百人来说,我需要让这个过程自动化。

此外,当我打开与Firefox的链接时,文件(文本文件)的内容在浏览器中显示,而不是DOWNLOADED,这对我来说可能很好,因为那时我可以阅读“源”(即文件格式的文件内容)并将其作为文件保存到磁盘。

任何线索?或者也许有一些现有的工具可以完成这项工作?

找到了!

在VB中编写的一个非常整洁的.NET HTTP下载类。唯一的问题是它用法语书写(但我是法国人,你......):-)。

这就是:

http://www.vbfrance.com/codes/NET2-CLASSE-TELECHARGEMENT-HTTP-AVEC-GESTION-RESUME-PROGRESSION_41850.aspx

随着一些调整,你可以安排samplehttp下载程序下载默默全部通过文件的URL,甚至管理的进展,通过一定的进展情况。

该类可以选择性地管理用户凭证并恢复中断的大文件下载。