查找文件在HTML页面中的链接并自动下载文件

问题描述：

我必须在几个网页中下载数百个由“< a href：”FileUrl“.../>”表示的文件。我试图用.NET Webbrowser控件创建一个.NET程序，打开一个URL（包含链接的页面），提取文档的源代码，找到链接... 所有这一切都是让人pe目结舌的，不是问题。查找文件在HTML页面中的链接并自动下载文件

现在，一旦我找到了一个链接，我指示web浏览器导航到该文件的链接，我提出了一个对话框，保存文件（或打开）等

一个或两个文件很好。对于数百人来说，我需要让这个过程自动化。

此外，当我打开与Firefox的链接时，文件（文本文件）的内容在浏览器中显示，而不是DOWNLOADED，这对我来说可能很好，因为那时我可以阅读“源”（即文件格式的文件内容）并将其作为文件保存到磁盘。

任何线索？或者也许有一些现有的工具可以完成这项工作？

答

找到了！

在VB中编写的一个非常整洁的.NET HTTP下载类。唯一的问题是它用法语书写（但我是法国人，你......）:-)。

这就是：

http://www.vbfrance.com/codes/NET2-CLASSE-TELECHARGEMENT-HTTP-AVEC-GESTION-RESUME-PROGRESSION_41850.aspx

随着一些调整，你可以安排samplehttp下载程序下载默默全部通过文件的URL，甚至管理的进展，通过一定的进展情况。

该类可以选择性地管理用户凭证并恢复中断的大文件下载。

查找文件在HTML页面中的链接并自动下载文件

相关推荐