【理解归纳】tensorflow-gpu 1.14.0版本安装与anaconda包与环境的管理

一开始我用的是cpu版本的tensorflow2.0.0，直接调模型的语法非常简洁，再者我的笔记本是有gpu的（现在哪台笔记本还能没gpu。。。）

于是想充分利用gpu来提速，再延续tensoflow2的简洁语法，装一个tensoflow-gpu 2.0.0

结果10小时过去了，愣是没弄成功！import tensorflow要么还是cpu版本，要么就直接导入失败，说找不到模块。

装失败的原因非常多，有配件版本不匹配，显卡驱动没装上，不懂环境管理的操作等等

后面想着，也不管什么简洁语法了，只要是tensorflow-gpu就行，别说1点几，哪怕是零点几的版本也好，求求你给我装上吧！！！

终于又过了5小时，在同学兔兔兔兔兔子拯救世界的不辞辛劳的帮助与演示、操作下，我总算装成功了tensorflow-gpu 1.14.0

【理解归纳】tensorflow-gpu 1.14.0版本安装与anaconda包与环境的管理

看着结果一行行蹦出来，看到“True”的那一瞬间真是感慨万千，有种十月怀胎的小孩终于呱呱坠地的感觉

首先声明我的电脑配置：

GPU是GeForce GTX 1050，最高支持10.0版本的CUDA

Pyhton=3.6.3

即将安装的是1.14.0版本的tensorflow-gpu，配套CUDA为10.0，cuDNN为7.6

接下来我就说一说自己对今天整个过程的认识

一、GPU版本的tensorflow有什么不同？为什么？

优点：

使用了GPU的tensorflow，犹如一把宝剑再装上一颗**宝石，对于大量的数据集，在训练过程中可以大幅度提升速度。比如同样是对10000张图片进行训练，CPU版本的tensorflow需要5分钟才能完成一轮，但GPU版本可能只需要30秒，速度大幅提升。如果一口气训练个100轮，那就是数小时的时间节省了。

为什么这么快？(比喻层面)

如果把GPU比作一辆车，CUDA就是车的驱动系统，驱动系统上有很多东西，比如方向盘，离合器，发动机等等，而cuDNN（英伟达深度学习框架）这个东西就是车的方向盘，如果我们需要，也可以安装别的构件，比如离合器，操作杆，但是要记住，像cuDNN这样的都是组件，是额外加到驱动系统CUDA上去的，CUDA才是承载这些组件的核心，而GPU就是核心CUDA背后的硬件支持

而tensorflow-gpu，就是驾驶员，我们运行代码时，tensorflow就去调用那个深度学习框架来加速，而深度学习框架是建立在CUDA上的，而CUDA又是建立在硬件GPU上的。所以tensoflow的版本和cuDNN的一对一性质很强，而cuDNN又依赖于CUDA的版本，CUDA又取决于GPU的类型，就很头秃，到底哪个tensorflow该配哪个系列的版本，众说纷纭。。。

背后怎么操作的？（个人理解）

GPU版本的tensorflow安装之后，包里面有一些.py文件会去调取电脑的硬件结构进行数据部署，比如get_available_gpu(), load_data2(gpu_device[i])。

我们知道python有os，sys等包，是直接对计算机深层做操作的，权限相当高，于是在这个过程中，后台就会运行一些程序，比如进入系统的cmd窗口，直接运行cudart_64等文件来进行cuDNN的操作。

既然说到cmd运行文件，那肯定又要提到配置环境变量了

我们经常在anaconda prompt里敲下python，然后进入python的编辑环境，开始写简单的测试代码，这背后其实就是一个叫做“环境变量”的东西在起作用，直接敲python，电脑就知道这肯定不是一个动宾结构的命令（比如cd E:\File），而是要打开某个文件，于是系统就去一个库里面找了，这个库里有一堆的文件夹（也就是路径），系统会从上往下挨个进去看一遍，里面有没有python.exe这个文件可以打开，找不到就换下一个文件夹再试试，直到找完这个库。当然往往能够找到。这个库是啥呢？其实就是系统的 “环境变量”的Path，在左下角的搜索框中输入huanjing

【理解归纳】tensorflow-gpu 1.14.0版本安装与anaconda包与环境的管理

进入，点击环境变量，进入这个页面

【理解归纳】tensorflow-gpu 1.14.0版本安装与anaconda包与环境的管理

这两个Path都是检索库，编辑其中一个是这样的

【理解归纳】tensorflow-gpu 1.14.0版本安装与anaconda包与环境的管理

看到了吧？一堆的文件夹在那，等着电脑去挨个检索，不过检索时，用户变量的Path优先，用户变量找不到了就去系统变量中找

所以说我们需要为安装好的CUDA和cuDNN配置好环境变量，让cmd可以直接打开里面的文件，这样tensorflow在运行时才能打开所需要的文件

落地到具体操作上，那就是去英伟达官网下载10.0版本的CUDA安装包和7.6.5的cuDNN压缩包

【理解归纳】tensorflow-gpu 1.14.0版本安装与anaconda包与环境的管理

安装cuda时，路径切记要默认，哪怕你的c盘小的不行也要留出空间，选择自定义安装，每个选项都展开，不要安装Visual Studio和Geforce Experience。

打开cuDNN，里面有lib，bin等文件夹。打开bin，把里面的东西复制，然后打开cuda的bin文件夹，在里面粘贴。同理把cuDNN

另外两个文件的内容也放到cuda的对应文件夹里。再把https://cn.dll-files.com/cudart64_101.dll.html链接里的文件加入到cuda的bin中

再将以下命令添加到系统环境变量的Path里面
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\libnvvp
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\include

现在离成功安装tensorflow-gpu还差两步：pip install ‘本地tensorflow轮子文件’，以及更新英伟达的驱动程序并重启。下次更新再写剩下的，太晚了

【理解归纳】tensorflow-gpu 1.14.0版本安装与anaconda包与环境的管理

相关推荐