基于GPU的tensorflow环境配置

这是19年初学faster rcnn时记下的一些笔记。
这几天主要的任务是用tensorflow配置并运行Faster-RCNN，配置好笔记本的环境，下载好各个需要用到的库。虽然说下几个软件说起来是很轻松的事，但这学期一直在不断的尝试配置tensorflow的GPU版本，但每次都因为一些解决不了的原因失败了，网上的教程太多了，自己也分不清该按照哪个版本来。
这次经过几天的不断尝试，终于成功地运行了Faster-RCNN，用的是同学已经训练过的模型。下面先讲配置步骤：
首先是下载并安装好cuda和cudnn，我的笔记本是windows版本的，下载好的tensorflow版本是1.5.0，对应要安装的cuda版本是9.0。同时cudnn的版本要是7.0.5才行，不然到最后运行测试时会出很多错。
然后是安装vs2015，这些vs2015，cuda之类的安装包都是用的同学的，所以省了很多事。然后在vs2015中编译cuda项目，这些在网上都有教程，最终编译结果如下图所示，则代表cuda安装成功了。
基于GPU的tensorflow环境配置
还有就是安装Anaconda3，之前我都是用的清华镜像，但现在已经停用了，官网那边也不会再更新其他版本了，所以这个安装包也是用的同学的。Anaconda安装成功后在直接在Anoconda Prompt里面进入conda环境，然后在conda环境中一个个安装相应的库，我因为重装了一次系统，电脑里面的环境都很干净，所以这次配置出的问题都不是很大，短时间内就能解决。最麻烦的两个就是tensorflow-gpu和pycocotools的安装，这两个库的安装前者是需要网络好和运气好，后者就是要通过不断的踩坑最后才能成功安装好。Pycocotools是因为之前根本就没有windows的官方版本，但之后又有大佬写了一个windows可用的版本，所以直接用pip install pycocotools根本行不通，需要下载一个git，然后用pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI才能行，在这个过程中实在是有很多麻烦的问题，要慢慢的在网上找解决方法才行。
所有库都成功安装上以后，开始测试代码的时候又突然出错了，python在运行过程中突然中断，在后面发现是我的cudnn版本跟cuda版本不对应的问题，我也不知道自己的cudnn版本怎么是7.17，之后在官网下载了7.05的版本并安装好终于就能成功运行了。
最后就是训练过程可视化软件pycharm的安装了，用这个软件打开Faster-RCNN的文件夹，直接运行其中的代码，就能很直观的看到训练过程和训练结果了，也很方便修改代码和查找错误。经过这次成功的配置确实学到了很多东西，不懂的地方要多问才行，光靠自己上网瞎找效率实在是低。
基于GPU的tensorflow环境配置
上图是选择的部分训练结果，是经过40000次训练之后的结果，可以看出精确度已经很高了。

基于GPU的tensorflow环境配置

相关推荐