MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

 

cudnn版本:

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

如下图 5.0.5  5.1.10版本都是可以的

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

CUDA8 搭配 CUDNN7是跑不通的,反正我是没运行成功。

 

用下面2行命令切换cudnn版本

sudo cp include/cudnn.h /usr/local/cuda/include/

sudo cp libcudnn* /usr/local/cuda/lib64/  (切换cudnn版本只需要这两行命令,因为cudnn是个加速库,拷贝进去直接调用就行了)

 

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

 

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

可以成功

 

 

修改arch架构后make: 一行注释引发的血案

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

这是个巨坑:  cuda Success 11 vs.0

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

 

如下图,算力和arch参数一定要适配自己的显卡。

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

 

爆炸,错误

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

也爆炸

 

注释掉20 21就爆炸:

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

 

我打印 net.name 是 VGG的模型,作者这里写的代码是要正则匹配 faster_rcnn,所以返回的是nonetype,也就没有group属性,所以我判断这里是作者自己加的测试代码,不是他github里面想测试的vgg model,于是我屏蔽掉就可以成功运行了。

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

 

 

还有model的名字要改,作者提供的是VOCdevkit,但是tool文件夹里面的py文件搜索的是VOCdevkit2007,所以要改过来才能运行。

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

改成VOCdevkit2007 ,这里也挖了一个坑。

 

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

注意执行命令的时候,和需要加载的模型名字一致,不要直接复制作者github上的代码,有错误,然而没人改正

 

MLKP复现的那些坑以及cuda Success 11 vs.0错误解决

作者提供的文件是缺省的,没有VGG16,。

 

做个记录,比较混乱,有问题欢迎留言,一起讨论学习。