GPU tensorflow运行问题
问题描述:
我已经安装了GPU tensorflow作为tutorial。相对环境是:GPU tensorflow运行问题
Ubuntu 14 + cuda8.0 + cudnn5.0 + GeForce Gt 640 (OEM)
的问题是:
E tensorflow/stream_executor/cuda/cuda_driver.cc:491] failed call to cuInit: CUDA_ERROR_NO_DEVICE
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:153] retrieving CUDA diagnostic information for host: wangyajie
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:160] hostname: wangyajie
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:185] libcuda reported version is: 352.63.0
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:356] driver version file contents: """NVRM version: NVIDIA UNIX x86_64 Kernel Module 340.98 Mon Sep 19 17:31:03 PDT 2016
GCC version: gcc version 4.8.4 (Ubuntu 4.8.4-2ubuntu1~14.04.3)
"""
I tensorflow/stream_executor/cuda/cuda_diagnostics.cc:189] kernel reported version is: 340.98.0
E tensorflow/stream_executor/cuda/cuda_diagnostics.cc:296] kernel version 340.98.0 does not match DSO version 352.63.0 -- cannot find working devices in this configuration
我能做些什么来解决这个问题? 我应该更新DSO吗?如果应该,应该使用什么命令?
如何检查的天气我安装CUDA和cudnn是否正确?应该使用什么命令?
在此先感谢! ZhQ
答
不知道这是怎么发生的,但是您的错误信息指出您的NVidia驱动程序内核模块与CUDA需要的版本不同。 (通常,如果您通过apt-get安装CUDA,它会检查这一点。)要解决此问题,您应该将驱动程序更新为352.63.0。说明可以在这里找到:
https://help.ubuntu.com/community/BinaryDriverHowto/Nvidia
然而,这可能无法完全解决您的问题,因为它可能很难同时获得CUDA和驱动程序安装到相同的版本,如果您单独安装它们。相反,你应该考虑从同一个仓库安装两个仓库,从而重新安装CUDA。
一般来说,如果可能的话,我建议你升级到Ubuntu 16.04首先,由于CUDA是痛苦要少得多,安装有(在我的经验,至少)。