如何在提交表单后使用WWW :: Mechanize下载文件?
我的代码:如何在提交表单后使用WWW :: Mechanize下载文件?
#!/usr/bin/perl
use strict;
use WWW::Mechanize;
my $url = 'http://divxsubtitles.net/page_subtitleinformation.php?ID=111292';
my $m = WWW::Mechanize->new(autocheck => 1);
$m->get($url);
$m->form_number(2);
$m->click();
my $response = $m->res();
print $m->response->headers->as_string;
它提交页面上的下载按钮,但我不知道如何下载它发送POST回来后的文件。
我想要一个方式,如果可能用的wget下载这个。我在想,他们可能是一个秘密的网址通过或什么?还是必须直接从响应流中直接下载LWP?
那我怎么下载是在头文件?
感谢,
科迪·古德曼
那么这扔我最多的东西是“mechanize-> form_number”子程序从1开始,而典型的程序为0。如果有人想知道如何下载响应头开始他们的指数,或下载标头附件 s,这是做到这一点的方法。
现在,这里是完整的代码来做我想要的。
#!/usr/bin/perl
use strict;
use WWW::Mechanize;
my $url = 'http://divxsubtitles.net/page_subtitleinformation.php?ID=111292';
my $m = WWW::Mechanize->new(autocheck => 1);
$m->get($url);
$m->form_number(2);
$m->click();
my $response = $m->res();
my $filename = $response->filename;
if (! open (FOUT, ">$filename")) {
die("Could not create file: $!");
}
print(FOUT $m->response->content());
close(FOUT);
我想你的代码,并返回HTML的一个栈的唯一http://
引用是:
http://www.w3c.org http://ad.z5x.net http://divxsubtitles.net http://feeds2read.net http://ad.z5x.net http://www.google-analytics.com http://cls.assoc-amazon.com使用的代码
my $content = $m->response->content();
while ($content =~ m{(http://[^/\" \t\n\r]+)}g) {
print("$1\n");
}
所以,我的意见给你:
1.添加use strict;
你的代码,你是编程失败,如果你不
2.阅读输出HTML并确定接下来要做什么,你还没有这样做,因此你问了一个不完整的问题。除非你确定你想下载的URL,你要求别人为你写一个程序。
一旦你确定你要下载的URL是得到它,然后写响应内容到一个文件中的一个简单的事情。例如
if (! open(FOUT, ">output.bin")) {
die("Could not create file: $!");
}
binmode(FOUT); # required for Windows
print(FOUT $m->response->content());
close(FOUT);
提交表格后,您可以使用:
$ mech-> save_content($文件名)
转储$ mech-内容>内容到$文件名。 $ filename将会覆盖 。如果有任何错误,就会死亡。
如果内容类型不首先“文/”,然后将内容保存 以二进制模式。
谢谢你的回答。虽然我正在看CPAN页面,但我错过了这一点,并且不得不通过很多糟糕的谷歌搜索结果,直到我找到你的结果。 –
当我用这个下载一个6页的pdf文件,它确实,但内容是空白的任何想法?什么地方出了错。 – msinfo
哦! $ mech-> save_content($ filename,binmode =>':raw',decoded_by_headers => 1);这帮了我 – msinfo