Ubuntu 16.04 深度学习环境搭建(nvidia + cuda + cudnn + tensorflow-gpu)
环境:Ubuntu16.04 显卡 GTX1060
在网上找了一些安装说明,花了半天把环境搭建好了。
本文有很多借鉴他人的地方,特别需要感谢圆点博士,他的 深度学习环境三步曲 的确很不错
安装准备:cuda安装包 cudnn安装包
需要留意的是 nvidia驱动版本、cuda版本、cudnn版本以及tensorflow版本之间的对应关系,否则极有可能会导致运行异常
我的版本搭配是:nvidia-384 + cuda-9.0 + cudnn-7.1 + tensorflow-1.9.0
1、安装nvidia 驱动
(1)禁用Ubuntu自带的默认驱动nouveau
cd /etc/modprobe.d
touch blacklist-nouveau.conf
gedit blacklist-nouveau.conf
在该文件最后增加以下两行
blacklist nouveau
options nouveau modeset=0
lsmod | grep nouveau 可以用来查看nouveau是否被禁止
(2)重启计算机,Ctrl+Alt+(F1~F6) 进入命令行模式
service lightdm stop关闭图形显示
(3)卸载已有驱动,并安装新的驱动
apt-get autoremove --purge nvidia*
apt-get install nvidia + tab键,可以在显示结果中选出想要安装的驱动版本
然后重启机器或者直接service lightdm start重启图形界面
输入nvidia-smi可以看到显卡驱动信息
2、安装CUDA和cudnn
(1)下载cuda安装包并安装
到官网下载相应版本的包
执行 sudo sh cuda_*.run
除了nvidia显卡驱动不装其他都装
安装完成后在/etc/profile中加入以下两行
export PATH=/usr/local/cuda-*/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-*/lib64:$LD_LIBRARY_PATH
nvcc –version 可以用来坎cuda是否安装成功
按照以下步骤来检验cuda是否安装成功
第一步:进入目录 /home/lmx/NVIDIA_CUDA-*_Samples/1_Utilities/deviceQuery
第二步:进行make进行编译
第三步:运行编译好的程序 ./deviceQuery
(2)下载cudnn包解压并替换到cuda中
cudnn包解压得到cuda文件夹,执行以下命令替换文件
cp cuda/include/* /usr/local/cuda-*/include
cp cuda/lib64/* /usr/local/cuda-*/lib64
3、安装 tensorflow
apt-get install python3-pip python3-dev
pip install tensorflow-gpu
进入python解释器,import tensorflow不报错即安装成功
后续问题还需在使用中发现