Ubuntu16.04环境下安装Pytorch

1、安装Ubuntu16.04.6

2、安装cuda到系统目录

          选择.run文件方式安装,并选择安装驱动.(如果执行了该步骤,后面可以免去单独安装驱动的步骤)

3、安装Anconda python3.7       

4、切记所有包的安装都使用清华镜像,切不可同时使用清华镜像和pytorch官方源以及python官方源

5、配置conda源

     使用命令或者在~/.coudarc文件中添加清华镜像

     conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/

     https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

     https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

     然后执行

     conda config --set show_channel_urls yes

     所有的anaconda python环境共享该配置

6、配置pip源

     mkdir ~/.pip

    cd ~/.pip

    gedit pip.conf

   添加以下内容到pip.conf文件

    [global]

    index-url = https://pypi.tuna.tsinghua.edu.cn/simple

    所有的anaconda python环境共享该配置

 7、创建新的python环境

Anaconda默认的环境以及各种包来自anaconda源,如果包的来源不一致会产生莫名其妙的问题,这里还在重新创建一个新的来自清华镜像的python环境,,且python版本不宜过高,我选为3.6。以下操作均在该环境下

conda create -n python36 python=3.6

conda activate python36

删除一个python环境 Conda remove -n python36 --all

8、安装pytorch

    打开pytorch官网,按照下图conda命令安装。如果不成功,可以多次执行conda命令.

   conda命令中的参数-c pytorch表示优先使用pytorch官方channels,因为已经添加了国内channels,所以一定去掉该参数,否则    还会使用pytorch的通道。

需要注意的是,使用conda命令安装的cuda包含cudnn,所以执行conda安装命令前务必确保GPU型号、cudnn版本号、cuda版本号一致。例如,我电脑上配备的是Pascal架构(计算能力6.1)GTX1060,即将安装的cuda10.1cudnn7.6.5之间的版本是一致的。

版本一致性信息可到下列网站查询

https://docs.nvidia.com/cuda/

https://docs.nvidia.com/deeplearning/sdk/index.html

Ubuntu16.04环境下安装Pytorch

9、conda命令成功执行后,执行下述测试代码,发现成功输出,说明pytorch安装成功了

Ubuntu16.04环境下安装Pytorch

10、执行下述语句,看看能不能使用cuda,如果输出false,说明cuda不可用

Ubuntu16.04环境下安装Pytorch

如果Pytorch安装成功,但是cuda却不可用,那时因为conda安装的cuda包并不包含显卡驱动(也没有安装nvcc),而安装pytorch前又没有安装cuda.

11、安装tensorboard

Pytorch使用tensorflow的tensorboard做可视化任务,因此需要在anaconda中安装tensorboard

Pytorchtensorflow共存在anaconda中会干扰tensorboard,所以不要安装tensorflow

安装tensorboard的pip命令如下

pip install tensorboard -i https://pypi.tuna.tsinghua.edu.cn/simple

如果配置过pip源,直接 pip install tensorboard即可