Ubuntu18.04.1 深度学习配置 GPU环境配置

Ubuntu18.04.1 深度学习配置 GPU环境配置(真实机,而非虚拟机

  • Ubuntu18.04.1、Cuda 9.1、cuDnn 7.0、anaconda3.5.0、Tensorflow1.8.0、Pycharm配置

说明

对于一些数据量很大的神经网络的运算,使用CPU训练速度很慢,所以使用GPU可以很大程度上加速网络的训练。

本篇博文大部分根据https://blog.****.net/weixin_41863685/article/details/80303963这位博主,写的非常详细,基本上照着可以一次安装成功。我在安装过程中有一些跟他不一样的地方(不知道是电脑的原因还是怎么回事)。记录下来,方便下次安装。

1、硬件与软件版本

显卡:GeForce GTX 1080 Ti * 2

CPU:Inter Core i7-6850K

系统:Ubuntu18.04.1

cuda:9.0版本

cuDnn:v7

anaconda:3.5.0版本

Tensorflow:1.8.0版本

Pycharm:下载最新的即可。

 2.Nvidia 显卡驱动安装

使用的是ppa源安装的方式

2.1  删除旧的驱动

原来Linux默认安装的显卡驱动不是Nvidia的驱动,所以应该先把旧的驱动卸载掉。

# 删除
sudo apt-get purge nvidia*

2.2  禁止自带的nouveau nvidia 驱动

 进入到       /etc/modprobe.d          目录下,看有没有blacklist.conf文件,如果有的话使用下面的命令;

#打开配置文件
sudo gedit /etc/modprobe.d/blacklist.conf

如果你的Ubuntu系统中没有 gedit 编辑器,有 vim 编辑器,使用下面的命令。
sudo vim /etc/modprobe.d/blacklist.conf 

如果没有上面的blacklist.conf文件,应该会有blacklist-nouveau.conf 文件,使用下面的命令;

#打开配置文件
sudo gedit /etc/modprobe.d/blacklist-nouveau.conf

如果你的Ubuntu系统中没有 gedit 编辑器,有 vim 编辑器,使用下面的命令。
sudo vim /etc/modprobe.d/blacklist-nouveau.conf

上面主要是需要打开配置文件,运行上面命令后,会弹出一个文本文件如下图所示。

Ubuntu18.04.1 深度学习配置 GPU环境配置

在这个文件的最后一行填写禁止配置内容。

blacklist nouveau
options nouveau modeset=0

填写后下图所示。

Ubuntu18.04.1 深度学习配置 GPU环境配置

更新配置文件

sudo update-initramfs -u

最后需要进行重启重启之后,因为禁止了显卡的驱动,所以重启后显示的效果很不好,通过这个可以看出,是否完成这一步操作。

2.3  添加Graphic Drivers PPA

sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update

查看合适的驱动版本:

ubuntu-drivers devices

如下图所示:

Ubuntu18.04.1 深度学习配置 GPU环境配置

从图中可以看出可以选择的驱动版本,在这里选则最高的版本415(也是recommended 版本)。通过如下命令进行安装,安装完成后重新启动。(安装过程有慢)

# 安装
sudo apt-get install nvidia-driver-396
# 重启
sudo reboot

安装完成后,通过如下命令检测是否安装成功.

sudo nvidia-smi

如果成功会显示下图所示。 

Ubuntu18.04.1 深度学习配置 GPU环境配置

继续输入如下命令: 

sudo nvidia-settings

显示下图,则说明安装成功。 

Ubuntu18.04.1 深度学习配置 GPU环境配置

完成显卡驱动安装。 

3.cuda 9.0 安装

3.1 下载文件

 首先在官网下载run文件,如图所示,选择适合的run文件。下载地址:https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1704&target_type=runfilelocal

Ubuntu18.04.1 深度学习配置 GPU环境配置

3.2 安装依赖库

 在下载完成后在运行这个run文件之前先安装依赖库,也不知道是干什么用的。反正给他安装了,再往下进行。

看的这个教程。https://blossomnoodles.github.io/cnBlogs/2018/04/30/Ubuntu18.04-Tensorlow-install.html

# 依赖库安装
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

但不做这步直接运行run文件会出现如图所示

Ubuntu18.04.1 深度学习配置 GPU环境配置

3.3 gcc降低版本 

 CUDA9.0要求GCC版本是5.x或者6.x,其他版本不可以,需要自己进行配置,通过以下命令才对gcc版本进行修改。

#查看版本
g++ --version

Ubuntu18.04.1 深度学习配置 GPU环境配置 

# 版本安装:
sudo apt-get install gcc-5
sudo apt-get install g++-5

Ubuntu18.04.1 深度学习配置 GPU环境配置

通过命令替换掉之前的版本:

sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50

3.4 安装cuda

 

 

 

 

3.5 环境配置 

3.6 测试是否安装成功

4. cuDnn v7 安装 

4.1 cuDnn v7 下载

4.2 安装

4.3 测试是否安装成功 

5. anaconda 3.5.0 安装

 

6.Tensorflow 1.8.0 安装

 

7.Pycharm 安装