dlib的CUDA加速

软硬件环境

  • Intel® Xeon® CPU E5-1607 v4 @ 3.10GHz
  • GTX 1070 Ti 32G
  • ubuntu 18.04 64bit
  • anaconda with python 3.6
  • CUDA 9.0

准备工作

N卡的驱动及CUDA的安装请见 https://blog.xugaoxiang.com/ai/ubuntu-cuda.html, 如果之前通过 conda 或者 pip 安装过dlib, 也必须要先卸载掉

conda uninstall dlib
pip uninstall dlib

因为dlib是用C++语言编写, 编译需要用到 cmake,

sudo apt install cmake 

dlib的CUDA支持

git clone https://github.com/davisking/dlib.git
cd dlib
mkdir build
cd build
cmake .. -DDLIB_USE_CUDA=1 -DUSE_AVX_INSTRUCTIONS=1
cmake --build .
cd ..
python setup.py install --yes USE_AVX_INSTRUCTIONS --yes DLIB_USE_CUDA

在编译的过程中注意看下终端的输出, 看看CUDA相关的状态

dlib的CUDA加速

dlib的CUDA加速

验证

在安装完毕后, 咱们来验证下是否安装成功

# python script

import dlib

print(dlib.__)

print(dlib.DLIB_USE_CUDA)

print(dlib.cuda.get_num_devices())

dlib的CUDA加速

参考资料

  1. https://github.com/davisking/dlib