基于GPU的tensorflow环境配置

这是19年初学faster rcnn时记下的一些笔记。
这几天主要的任务是用tensorflow配置并运行Faster-RCNN,配置好笔记本的环境,下载好各个需要用到的库。虽然说下几个软件说起来是很轻松的事,但这学期一直在不断的尝试配置tensorflow的GPU版本,但每次都因为一些解决不了的原因失败了,网上的教程太多了,自己也分不清该按照哪个版本来。
这次经过几天的不断尝试,终于成功地运行了Faster-RCNN,用的是同学已经训练过的模型。下面先讲配置步骤:
首先是下载并安装好cuda和cudnn,我的笔记本是windows版本的,下载好的tensorflow版本是1.5.0,对应要安装的cuda版本是9.0。同时cudnn的版本要是7.0.5才行,不然到最后运行测试时会出很多错。
然后是安装vs2015,这些vs2015,cuda之类的安装包都是用的同学的,所以省了很多事。然后在vs2015中编译cuda项目,这些在网上都有教程,最终编译结果如下图所示,则代表cuda安装成功了。
基于GPU的tensorflow环境配置
还有就是安装Anaconda3,之前我都是用的清华镜像,但现在已经停用了,官网那边也不会再更新其他版本了,所以这个安装包也是用的同学的。Anaconda安装成功后在直接在Anoconda Prompt里面进入conda环境,然后在conda环境中一个个安装相应的库,我因为重装了一次系统,电脑里面的环境都很干净,所以这次配置出的问题都不是很大,短时间内就能解决。最麻烦的两个就是tensorflow-gpu和pycocotools的安装,这两个库的安装前者是需要网络好和运气好,后者就是要通过不断的踩坑最后才能成功安装好。Pycocotools是因为之前根本就没有windows的官方版本,但之后又有大佬写了一个windows可用的版本,所以直接用pip install pycocotools根本行不通,需要下载一个git,然后用pip install git+https://github.com/philferriere/cocoapi.git#subdirectory=PythonAPI才能行,在这个过程中实在是有很多麻烦的问题,要慢慢的在网上找解决方法才行。
所有库都成功安装上以后,开始测试代码的时候又突然出错了,python在运行过程中突然中断,在后面发现是我的cudnn版本跟cuda版本不对应的问题,我也不知道自己的cudnn版本怎么是7.17,之后在官网下载了7.05的版本并安装好终于就能成功运行了。
最后就是训练过程可视化软件pycharm的安装了,用这个软件打开Faster-RCNN的文件夹,直接运行其中的代码,就能很直观的看到训练过程和训练结果了,也很方便修改代码和查找错误。经过这次成功的配置确实学到了很多东西,不懂的地方要多问才行,光靠自己上网瞎找效率实在是低。
基于GPU的tensorflow环境配置
上图是选择的部分训练结果,是经过40000次训练之后的结果,可以看出精确度已经很高了。