爬虫之phantomJS简单使用
1、安装phantomJS
安装phantomJS有两种,一种是下载源码之后自省编译,另外一种是直接下载编译好的二进制文件,官方推荐直接使用编译好的二进制文件。安装下载地址 https://phantomjs.org/download.html 选择适合自己系统的版本下载即可,建议为PhantomJS设置环境变量,在下载的安装包中,其中一个example文件夹,里面有很多官方的例子可供参考
安装完成后在命令行输入:phantomjs -v 如果正常显示版本号,则证明安装配置成功
注:配置phantomjs环境变量步骤我的电脑->属性->高级系统设置->环境变量,用户变量下path添加phantomjs的解压文件路径
2、使用phantomJS
运行文件 :phantomjs 文件名
2.1、页面加载
var page = require('webpage').create(); page.open('http://www.baidu.com', function (status) { console.log("status: " + status); if (status === "success"){ page.render('yemian.png'); } else console.log(111111111); phantom.exit() });
结果在当前目录下显示页面.png图片
代码解释:首先使用webpage模块创建一个page对象,然后通过page对象打开百度页面,如果请求响应状态为success,则通过render方法将当前页面保存为yemian.png