爬虫之phantomJS简单使用

1、安装phantomJS

    安装phantomJS有两种,一种是下载源码之后自省编译,另外一种是直接下载编译好的二进制文件,官方推荐直接使用编译好的二进制文件。安装下载地址 https://phantomjs.org/download.html 选择适合自己系统的版本下载即可,建议为PhantomJS设置环境变量,在下载的安装包中,其中一个example文件夹,里面有很多官方的例子可供参考

    安装完成后在命令行输入:phantomjs -v 如果正常显示版本号,则证明安装配置成功

爬虫之phantomJS简单使用

    注:配置phantomjs环境变量步骤我的电脑->属性->高级系统设置->环境变量,用户变量下path添加phantomjs的解压文件路径

2、使用phantomJS

    运行文件 :phantomjs 文件名

2.1、页面加载

var page = require('webpage').create();
page.open('http://www.baidu.com', function (status) {
    console.log("status: " + status);
    if (status === "success"){
        page.render('yemian.png');
    }
    else
        console.log(111111111);
    phantom.exit()
});

结果在当前目录下显示页面.png图片

代码解释:首先使用webpage模块创建一个page对象,然后通过page对象打开百度页面,如果请求响应状态为success,则通过render方法将当前页面保存为yemian.png