Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤

1.前置准备

  1. 实验条件是在Windows系统下;
  2. Windows系统下,已安装Python3(此处建议安装Anaconda3,是Python开发环境,用来管理不同版本的Python环境,自带很多常用软件包以及科学计算包。总之,使用它会给你带来很多便捷,慢慢体会吧!)
  3. 已安装pip包管理工具;

2.Selenium简介和安装

1.Selenium是自动化测试工具,利用Selenium可以驱动浏览器执行特定的动作(点击,下拉等操作),针对JavaScript渲染的页面,这种抓取方式very good。
2.简单粗暴的安装方法,建议使用pip;
a)在cmd命令行中,输入:pip install selenium,(有时pip有别名pip3,即pip3 install selenium)
b)其他方式安装(只做介绍,强烈建议使用pip来安装):①selenium官网;②GitHub;③Pypi;④wheel;等方式进行安装。
c)pip安装步骤演示:
在cmd命令行中,输入:pip install selenium
Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
验证是否安装成功,在python命令行交互模式下,导入Selenium包,如无报错=>安装成功;
在windows下的cmd命令行中,键入python,进入python命令交互模式下;
Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
无报错,表示安装成功;
Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
如果想要使用selenium,还需要用Chrome,Firefox等这样的浏览器来配合Selenium一起工作。下面介绍Chrome、Firefox、PhantomJS三种浏览器的配置方式,有了它们,我们再配合Selenium进行页面抓取就牛了…

3.ChromeDriver的安装

  1. 如果使用Chrome浏览器配合Selenium来使用,那么需要安装ChromeDriver驱动的配置。
  2. ChromeDriver的安装步骤
    a)查看自己的Chrome浏览器的版本;打开Chrome浏览器->帮助->关于Goolge Chrome(G)
    Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
    b)按照自己的Chrome浏览器版本,去找相邻近的ChromeDriver驱动版本;我是用的是这个网址进行查找ChromeDriver对应的驱动:https://npm.taobao.org/mirrors/chromedriver/ (当然你也可以直接在浏览器中键入:chromedriver,然后自己找对应的版本),这里我找到的是大版本号一样的chromedriver驱动(如果找不到一样的对应版本号,只要大版本号可以,应该就行)
    Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
    c)点击进入这个目录:能看到linux,mac,windows版本的,这里只有windows32版本,下载这个就行,64位电脑也会向下兼容的;
    Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
    d)下载完成后,解压出一个chromedriver.exe,可以将这个执行文件加入到电脑的环境变量中,建议直接将他放到python3的script中,我的是安装的Anaconda3,所以直接放到这个的script目录下;
    Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
    e)验证是否安装成功;
    在cmd命令行下,输入:chromedriver,出现如下提示表示安装没问题;
    Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
    g)随后,让我们在python环境中看看,是否会驱动Chrome浏览器,
    在python交互界面输入:
    from selenium import webdriver
    browser = webdriver.Chrome()
    运行之后,会弹出一个空白的Chrome浏览器页面,证明所有配置无问题,如果没有弹出或弹出闪退,请检查每一步的配置,chrome浏览器和chromedriver驱动的兼容性问题等;

4.GeckoDriver的安装

  1. 如果使用Firefox浏览器配合Selenium来使用,那么需要安装GeckoDriver驱动的配置。
  2. GeckoDriver的安装步骤
    a)查看自己的Firefox浏览器的版本;打开Firefox浏览器->帮助->关于Firefox
    Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
    b)在https://github.com/mozilla/geckodriver/releases找到最新版下载v0.26.0;
    Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
    c)下载完成后,解压出一个geckodriver.exe,可以将这个执行文件加入到电脑的环境变量中,建议直接将他放到python3的script中,我的是安装的Anaconda3,所以直接放到这个的script目录下;
    Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
    d)验证安装
    在cmd命令行中,键入geckodrvier,有返回就正常,但是我键入了命令,没有返回相关执行日志,然后我试了e);

e)在python环境中试一下,看看是否能驱动Firebox,输入命令,可以正常弹出firefox浏览器页面,应该能用吧,先这样吧;
Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤

5.PhantomJS的安装

1.PhantomJS是一个*面的、可脚本编程的WebKit浏览器引擎,它支持多种Web标准,DOM操作,CSS选择器,JSON,Canvas以及SVG;不过现在Selenium不在对它支持了,虽然能用,但是还是建议选择,无厘头的Chrome,Firefox吧,
2. 由于不在支持,我这里也就简单说安装步骤,基本都一样
a)网上搜索一下PhantomJS然后下载一个版本就行,下载后解压出来的是
Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
可以将bin下的添加到环境变量中,或者直接将bin下的phantomjs.exe也放到script中去即可。
b)在cmd下看看phantomjs的版本
Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
再在python环境下试试
Windows下Selenium和ChromeDriver、GeckoDriver、PhantomJS的安装步骤
看到了吗,已经被停止支持了,要想使用还得降级Selenium来使用;