'wget'基于框架的完整网站

问题描述:

我有一个小问题。我想递归下载that web page,但它基于“帧”。标准方法不能帮助我。我尝试不同的变体,但没有。最大可以下载一个递归,我找到了示例there。我怎样才能完全抓住这个网站,而不是离线使用它?谢谢。'wget'基于框架的完整网站

+0

也许你正在寻找应用程序镜像?对于Windows我知道WinHTTrack和Teleport Pro;我确信有其他操作系统的一些替代品。 – Kos 2010-12-11 13:23:20

+0

我想,我会在失败后尝试一下。我想从Linux和命令'wget'。 – 2010-12-11 13:25:12

你用什么命令?你在MSWindows上吗?例如。 “wget的--mirror -w 2 -p --html扩展 - 转换链接-P C:\ wget_files \例1 http://base.safework.ru/iloenc

+0

我使用linux,它的本地命令wget。我试图这样做,但它递归地解析自己(框架,帧中帧,帧中帧....和无穷大。所有帧来自第一页,而不是来自其他页面)。 – 2010-12-20 20:14:25

如果你想一个网站使用的本地副本--mirror

wget --mirror http://www.example.com/ 

一些其他的选择也很管用:

- 转换链接转换绝对链接到本地​​链接,这样你就可以在本地浏览该网站。

--html扩展增加的.html到没有后缀的任何资源(该方法适用于通过Apache本地浏览,否则非常有活力的网站)

-p获取图像,CSS和所需的所有资源,为页面加载

所以:

wget --mirror --convert-links --HTML-extension -p http://www.example.com/ 

最后,如果它不是你的网站,然后礼貌,并添加一个-w(请求之间的等待时间,以秒为单位)

+0

谢谢,但我知道如何使用该命令。尝试解析http://base.safework.ru/iloenc。这个网站是基于框架的,我不能用默认的方法来做(((就像那样,我只会得到第一页框架,并且会获得它的无穷大,但是不会有其他页面和框架) – 2010-12-21 16:44:17

试试这个:

wget -E -H -k -K -p "http://yoursite.com/path" 

适合我的使用案例(下载参考帧HTMLS)

+1

你能解释那些命令行选项,还是至少链接到参考? – deltree 2016-02-14 17:52:41